ระบบคอมพิวเตอร์

เครื่องสแกน (scanner)

เครื่องสแกน คือ อุปกรณ์ต่อเชื่อมคอมพิวเตอร์แบบกราฟิก ที่มีหน้าที่ ในการเปลี่ยนแปลงภาพต้นฉบับ (รูปถ่าย ตัวอักษรบนหน้ากระดาษ ภาพวาด) ให้เป็นข้อมูล เพื่อให้คอมพิวเตอร์ สามารถนำข้อมูลดังกล่าว มาใช้ประโยชน์ ในการแสดงผลที่หน้าจอ ทำให้สามารถแก้ไข ตกแต่งเพิ่มเติม และจัดเก็บข้อมูลได้

คำว่าสแกน (scan) หมายถึง กราดตรวจ, กราดภาพ
เครื่องสแกน หรือ เครื่องกราดภาพ จะทำการตรวจสอบข้อมูลในลักษณะตัวอักษร หรือภาพโดยเรียงลำดับทีละส่วน นั่นเอง

ประเภทของเครื่องสแกน (scanner)

Desktop scanner มีลักษณะเป็นแท่นในแนวราบ แบ่งเป็น 2 แบบ
แบบใส่กระดาษ แล้วเลื่อนกระดาษเอง เรียกว่า sheetfed scanner
แบบวางกระดาษ แล้วให้หัวสแกนเลื่อนอ่าน ข้อมูลจากกระดาษ เรียกว่า flatbed Scanner

Handy scanner มีขนาดเล็ก สามารถจับถือได้

งานของเครื่องสแกน (scanner)

สแกนเนอร์ มีหลักการทำงาน คือ เครื่องอ่านภาพ จะทำการอ่านภาพโดยอาศัยการสะท้อน หรือการส่องผ่านของแสง กับภาพต้นฉบับที่ทึบแสง หรือโปร่งแสง ให้ตกกระทบกับ แถบของอุปกรณ์ไวแสง (photosensitive) ซึ่งมีชื่อในทางเทคนิคว่า Charge-Couple Device (CCD) ตัว CCD จะรับแสงดังกล่าวลงไปเก็บไว้ใน เส้นเล็กของเซล และจะแปลงคลื่นแสง ของแต่ละเซลเล็กๆ ให้กลายเป็นคลื่นความต่างศักย์ ซึ่งจะแตกต่างไปตามอัตราส่วน ของระดับความเข้มของแสงแต่ละจุด

ตัวแปลงสัญญาณอะนาล็อก เป็นดิจิทัล หรือ ADC : Analog to Digital Convertor จะแปลงคลื่นความต่างศักย์ ให้เป็นข้อมูล ในรูปแบบที่คอมพิวเตอร์เข้าใจ ในเวลาเดียวกัน โปรแกรมในการอ่าน จะควบคุมการทำงาน ของเครื่องอ่านภาพ ให้รับข้อมูลเข้า และจัดรูปแบบเป็นแฟ้มข้อมูลของภาพ ในระบบคอมพิวเตอร์ต่อไป

ภาพจากการสแกน

ภาพในคอมพิวเตอร์ จะอยู่ในรูปแบบดิจิทัล คอมพิวเตอร์แทนส่วนเล็ก ๆ ของภาพที่เรียกว่า พิกเซล (pixels) ขนาดของไฟล์รูปภาพ จะประกอบด้วย จำนวนพิกเซลเป็นร้อยเป็นพัน คอมพิวเตอร์จะบันทึก ค่าความเข้ม และค่าสีของพิกเซลแต่ละพิกเซล ด้วยจำนวน 1 บิต หรือหลายๆ บิต จำนวนของพิกเซล จะเป็นตัวแสดงถึงความละเอียด และถ้ามีจำนวนบิตต่อพิกเซลมาก สีที่ได้ก็จะมากตามไปด้วย

รูปแบบการเก็บข้อมูล มีหลายระบบ เช่น 1 บิต 8 บิต และ 24 บิต โดยถ้าเป็นข้อมูลแบบ 1 บิต จะใช้สำหรับเก็บข้อมูลต่อพิกเซล 2 สถานะ คือ 1 และ 0 ซึ่งจะแสดงสีได้เฉพาะขาวกับดำ แต่ถ้าเป็น 8 บิต จะใช้ความแตกต่างของสีถึง 256 ระดับ การรวมแม่สีมีเทคนิคที่เรียกว่า dithering ซึ่งจะแสดงสีได้ไม่เหมือนกับ ความจริงที่เรามองเห็นได้ สำหรับระบบ 24 บิต จะให้ภาพที่มีสีใกล้เคียงจริงมากที่สุด เรียกว่า photo-realistic โดยจะแบ่ง 24 บิต เป็น 3 ส่วน คือ แดง, เขียว, น้ำเงิน ส่วนละ 8 บิต เมื่อรวมทั้ง 3 ส่วนเข้ากันแล้ว จะสามารถแสดงสีได้ถึง 16.7 ล้านสี

RGB

การอ่านภาพสี CCD ของเครื่องอ่านภาพ จะมีการประมวลผล โดยอาศัยโครงสร้างของแม่สี 3 สี คือ แดง, เขียว และน้ำเงิน ในทางเทคนิคจะเรียกว่า RGB ในโครงสร้างสีแบบ RGB นี้แต่ละสีที่เกิดขึ้นจะประกอบด้วยแม่สีทั้ง 3 สีรวมอยู่ด้วยกันในค่าที่ต่างกันไป สีดำเกิดขึ้นจาก การไม่มีแสงสีขาว ในทำนองเดียวกัน สีขาวก็เกิดจากแสงแม่สีทั้ง 3 อยู่ในระดับสูงสุดเท่าๆ กัน (100 เปอร์เซ็นต์ของ RGB) และระดับแสงเท่าๆ กันของทั้ง 3 แม่สีจะเกิดแสงสีเทา (gray scale)

การทำงานของเครื่องสแกน

ส่วนประกอบที่สำคัญของสแกนเนอร์คือแหล่งกำเนิดแสงซึ่งจะทำหน้าที่ฉายแสงไปที่กระดาษที่วางอยู่บนกระจก พื้นที่สีขาวที่ฝาปิดจะช่วยให้การสะท้อนของแสงดีขึ้น เมื่อคุณสั่งให้สแกนเนอร์ทำงาน มอเตอร์จะขับเคลื่อนหัวสแกนผ่านใต้กระดาษ ในระหว่างที่เคลื่อนที่นี้หัวแสกนจะจับแสงที่สะท้อนมาจากแต่ละพื้นที่ของกระดาษด้วย ซึ่งพื้นที่นี้จะมีขนาดประมาณ 1/90,000 ตารางนิ้ว แสงจากกระดาษจะสะท้อนผ่านระบบกระจกเพื่อทำให้ลำแสงนั้นได้ไปในทิศทางที่เหมาะสมไปยังเลนส์ เลนส์จะรวมแสงเพื่อไปผ่านไดโอดแสง เพื่อแปลงข้อมูลแสงนี้ให้อยู่ในรูปของกระแสไฟฟ้า
ถ้ามีแสงผ่านไปที่ไดโอดมากปริมาณของกระแสไฟฟ้าที่ได้ก็จะมากขึ้น
ถ้าเป็นสแกนเนอร์แบบสี แสงที่สะท้อนนี้จะผ่านไปยังฟิลเตอร์แดง เขียว หรือน้ำเงินที่อยู่หน้าไดโอด ADC จะเก็บข้อมูลแอนะล็อกแต่ละส่วนนี้ไว้ ซึ่งข้อมูลแต่ละส่วนนี้เรียกว่า พิกเซล ซึ่งในความยาวหนึ่งนิ้วจะประกอบด้วยพิกเซลประมาณ 300-1,200 พิกเซล

การเคลื่อนที่ของสแกนเนอร์บางประเภท ตัวกระดาษไม่เคลื่อนที่ สิ่งที่เคลื่อนที่คือ หัวสแกน แต่ในสแกนเนอร์ระดับสูงหัวอ่านจะไม่เคลื่อนที่ จะมีตัวหมุนกระดาษเข้าไป ด้วยวิธีนี้ทำให้คุณภาพที่ได้จากการสแกนเนอร์แบบนี้สูงกว่า

โปรแกรมรู้จำัตัวอักษร

การทำงานของโปรแกรมรู้จำตัวอักษร หรือ OCR ย่อมาจาก Optical Character Recognition

เมื่อสแกนเนอร์อ่านข้อมูลจากภาพของเอกสาร มันจะเปลี่ยนข้อมูลนี้ให้อยู่ในรูปแบบ บิตแมป ซึ่งเป็นเมตริกซ์ของพิกเซล มีค่า 2 ค่า คือ ปิด (ขาว) และ เปิด(ดำ) ซึ่งจะทำให้ภาพที่ได้มีความคมชัดลดลงไปซึ่งผลกระทบในจุดนี้ทำให้เกิดปัญหากับซอฟต์แวร์OCR พอสมควร

โปรแกรม OCR จะอ่านบิตแมปที่สร้างโดยสแกนเนอร์ และเฉลี่ยพื้นที่ที่ปิดและเปิดของหน้ากระดาษ ซึ่งมีผลต่อพื้นที่สีขาวในหน้ากระดาษด้วย การทำเช่นทำให้ซอฟต์แวร์สามารถแยกองค์ประกอบต่างๆ ไม่ว่าจะเป็นย่อหน้า คอลัมน์ หัวข้อ และกราฟิกอื่นๆ ช่องว่างสีขาวระหว่างบรรทัดในบล็อกจะใช้เป็น baseline ของแต่ละบรรทัดในบล็อก ซึ่งจำเป็นมากในการรู้จำตัวอักษรต่างๆ

ในการเปลี่ยนรูปภาพเป็นข้อความในรอบแรก ซอฟต์แวร์จะพยายามเปรียบเทียบแต่ละพิกเซลกับเท็มเพลตของอักษรที่ซอฟ์แวร์เก็บไว้ในหน่วยความจำ เท็มเพลตนี้ จะมีรูปแบบของอักขระครบทุกแบบ ไม่ว่าจะเป็นตัวอักษร ตัวเลข และสัญลักษณ์ต่างๆ แต่วิธีนี้จะใช้ได้กับภาพตัวอักษรที่ใกล้เคียงกับตัวอย่างมาก ถ้าภาพที่ได้จากการสแกนมีคุณภาพไม่เพียงพอจะทำให้การตีความอักษรผิดพลาดได้

ตัวอักษรอื่นที่ไม่สามารถตีความได้ว่าเป็นตัวอักษรใด จำเป็นต้องผ่านกระบวนการที่ใช้เวลาในการประมวลผลมากกว่า เรียกว่า Feature Extraction ซอฟต์แวร์จะคำนวณความสูงของอักขระตัวเล็กและวิเคราะห์องค์ประกอบของตัวนั้น เช่น เส้นตรง เส้นโค้ง และพื้นที่ปิด ซึ่งซอฟต์แวร์จะมีข้อมูลเหล่านี้อยู่ในตัวมันเองอยู่แล้วว่าตัอักขระตัวใดมีลักษณะเป็นอย่างไร แล้วจึงตีความว่าตัวขระนั้นน่าจะเป็นตัวอะไร และจะเก็บไว้ใช้ต่อไป เมื่อมีการพบรูปอักขระเดิมการวิเคราะห์จะทำได้เร็วขึ้น

เนื่องจากทั้งสองกระบวนการนี้ไม่สามารถตีความได้ทุกตัวอักษร ซอฟต์แวร์บางตัวจะจัดการกับตัวอักขระที่ตีความไม่ได้ให้เป็น ตัวอักขระแบบพิเศษ เช่น #, @, ~ เป็นต้น คุณจำเป็นต้องหาอักขระที่ถูกต้องด้วยตัวคุณเอง ซอฟต์แวร์บางตัวก็จะขึ้นรูปตัวอักขระแล้วถามว่าตัวนี้ไม่รู้จักจะให้ตีความเป็นอักขระใด

โปรแกรม OCR บางตัวจะเรียกใช้ฟังก์ชันตรวจคำผิดเพื่อหาข้อผิดพลาดอย่างชัดแจ้งและแก้ไขให้โดยอัตโนมัติ และซอฟต์แวร์ส่วนใหญ่จะมีความสามารถเปลี่ยนเอกสารที่ได้นี้ให้สามารถใช้งานได้โดย โปรแกรม Word processor ที่นิยมใช้งานทั่วไปให้โดยอัตโนมัต