เครื่องสแกน
(scanner)
 |
เครื่องสแกน
คือ อุปกรณ์ต่อเชื่อมคอมพิวเตอร์แบบกราฟิก ที่มีหน้าที่ ในการเปลี่ยนแปลงภาพต้นฉบับ
(รูปถ่าย ตัวอักษรบนหน้ากระดาษ ภาพวาด) ให้เป็นข้อมูล เพื่อให้คอมพิวเตอร์
สามารถนำข้อมูลดังกล่าว มาใช้ประโยชน์ ในการแสดงผลที่หน้าจอ ทำให้สามารถแก้ไข
ตกแต่งเพิ่มเติม และจัดเก็บข้อมูลได้
คำว่าสแกน
(scan) หมายถึง กราดตรวจ, กราดภาพ
เครื่องสแกน หรือ เครื่องกราดภาพ จะทำการตรวจสอบข้อมูลในลักษณะตัวอักษร หรือภาพโดยเรียงลำดับทีละส่วน
นั่นเอง
|
ประเภทของเครื่องสแกน (scanner)
 |
Desktop
scanner มีลักษณะเป็นแท่นในแนวราบ แบ่งเป็น 2 แบบ
แบบใส่กระดาษ แล้วเลื่อนกระดาษเอง เรียกว่า sheetfed scanner
แบบวางกระดาษ แล้วให้หัวสแกนเลื่อนอ่าน ข้อมูลจากกระดาษ เรียกว่า flatbed
Scanner |
 |
Handy scanner มีขนาดเล็ก สามารถจับถือได้ |
งานของเครื่องสแกน (scanner)
สแกนเนอร์ มีหลักการทำงาน คือ เครื่องอ่านภาพ จะทำการอ่านภาพโดยอาศัยการสะท้อน
หรือการส่องผ่านของแสง กับภาพต้นฉบับที่ทึบแสง หรือโปร่งแสง ให้ตกกระทบกับ
แถบของอุปกรณ์ไวแสง (photosensitive) ซึ่งมีชื่อในทางเทคนิคว่า Charge-Couple
Device (CCD) ตัว CCD จะรับแสงดังกล่าวลงไปเก็บไว้ใน เส้นเล็กของเซล และจะแปลงคลื่นแสง
ของแต่ละเซลเล็กๆ ให้กลายเป็นคลื่นความต่างศักย์ ซึ่งจะแตกต่างไปตามอัตราส่วน
ของระดับความเข้มของแสงแต่ละจุด
ตัวแปลงสัญญาณอะนาล็อก เป็นดิจิทัล หรือ ADC : Analog to Digital Convertor จะแปลงคลื่นความต่างศักย์
ให้เป็นข้อมูล ในรูปแบบที่คอมพิวเตอร์เข้าใจ ในเวลาเดียวกัน โปรแกรมในการอ่าน
จะควบคุมการทำงาน ของเครื่องอ่านภาพ ให้รับข้อมูลเข้า และจัดรูปแบบเป็นแฟ้มข้อมูลของภาพ
ในระบบคอมพิวเตอร์ต่อไป
ภาพจากการสแกน
ภาพในคอมพิวเตอร์ จะอยู่ในรูปแบบดิจิทัล คอมพิวเตอร์แทนส่วนเล็ก ๆ ของภาพที่เรียกว่า
พิกเซล (pixels) ขนาดของไฟล์รูปภาพ จะประกอบด้วย จำนวนพิกเซลเป็นร้อยเป็นพัน
คอมพิวเตอร์จะบันทึก ค่าความเข้ม และค่าสีของพิกเซลแต่ละพิกเซล ด้วยจำนวน
1 บิต หรือหลายๆ บิต จำนวนของพิกเซล จะเป็นตัวแสดงถึงความละเอียด และถ้ามีจำนวนบิตต่อพิกเซลมาก
สีที่ได้ก็จะมากตามไปด้วย
รูปแบบการเก็บข้อมูล มีหลายระบบ เช่น 1 บิต 8 บิต และ 24 บิต โดยถ้าเป็นข้อมูลแบบ
1 บิต จะใช้สำหรับเก็บข้อมูลต่อพิกเซล 2 สถานะ คือ 1 และ 0 ซึ่งจะแสดงสีได้เฉพาะขาวกับดำ
แต่ถ้าเป็น 8 บิต จะใช้ความแตกต่างของสีถึง 256 ระดับ การรวมแม่สีมีเทคนิคที่เรียกว่า
dithering ซึ่งจะแสดงสีได้ไม่เหมือนกับ ความจริงที่เรามองเห็นได้ สำหรับระบบ
24 บิต จะให้ภาพที่มีสีใกล้เคียงจริงมากที่สุด เรียกว่า photo-realistic
โดยจะแบ่ง 24 บิต เป็น 3 ส่วน คือ แดง, เขียว, น้ำเงิน ส่วนละ 8 บิต เมื่อรวมทั้ง
3 ส่วนเข้ากันแล้ว จะสามารถแสดงสีได้ถึง 16.7 ล้านสี
RGB
การอ่านภาพสี CCD ของเครื่องอ่านภาพ จะมีการประมวลผล โดยอาศัยโครงสร้างของแม่สี
3 สี คือ แดง, เขียว และน้ำเงิน ในทางเทคนิคจะเรียกว่า RGB ในโครงสร้างสีแบบ
RGB นี้แต่ละสีที่เกิดขึ้นจะประกอบด้วยแม่สีทั้ง 3 สีรวมอยู่ด้วยกันในค่าที่ต่างกันไป
สีดำเกิดขึ้นจาก การไม่มีแสงสีขาว ในทำนองเดียวกัน สีขาวก็เกิดจากแสงแม่สีทั้ง
3 อยู่ในระดับสูงสุดเท่าๆ กัน (100 เปอร์เซ็นต์ของ RGB) และระดับแสงเท่าๆ
กันของทั้ง 3 แม่สีจะเกิดแสงสีเทา (gray scale)
การทำงานของเครื่องสแกน
ส่วนประกอบที่สำคัญของสแกนเนอร์คือแหล่งกำเนิดแสงซึ่งจะทำหน้าที่ฉายแสงไปที่กระดาษที่วางอยู่บนกระจก พื้นที่สีขาวที่ฝาปิดจะช่วยให้การสะท้อนของแสงดีขึ้น เมื่อคุณสั่งให้สแกนเนอร์ทำงาน มอเตอร์จะขับเคลื่อนหัวสแกนผ่านใต้กระดาษ ในระหว่างที่เคลื่อนที่นี้หัวแสกนจะจับแสงที่สะท้อนมาจากแต่ละพื้นที่ของกระดาษด้วย ซึ่งพื้นที่นี้จะมีขนาดประมาณ 1/90,000 ตารางนิ้ว แสงจากกระดาษจะสะท้อนผ่านระบบกระจกเพื่อทำให้ลำแสงนั้นได้ไปในทิศทางที่เหมาะสมไปยังเลนส์ เลนส์จะรวมแสงเพื่อไปผ่านไดโอดแสง เพื่อแปลงข้อมูลแสงนี้ให้อยู่ในรูปของกระแสไฟฟ้า
ถ้ามีแสงผ่านไปที่ไดโอดมากปริมาณของกระแสไฟฟ้าที่ได้ก็จะมากขึ้น
ถ้าเป็นสแกนเนอร์แบบสี แสงที่สะท้อนนี้จะผ่านไปยังฟิลเตอร์แดง เขียว หรือน้ำเงินที่อยู่หน้าไดโอด ADC จะเก็บข้อมูลแอนะล็อกแต่ละส่วนนี้ไว้ ซึ่งข้อมูลแต่ละส่วนนี้เรียกว่า พิกเซล
ซึ่งในความยาวหนึ่งนิ้วจะประกอบด้วยพิกเซลประมาณ 300-1,200 พิกเซล
การเคลื่อนที่ของสแกนเนอร์บางประเภท ตัวกระดาษไม่เคลื่อนที่ สิ่งที่เคลื่อนที่คือ หัวสแกน แต่ในสแกนเนอร์ระดับสูงหัวอ่านจะไม่เคลื่อนที่ จะมีตัวหมุนกระดาษเข้าไป ด้วยวิธีนี้ทำให้คุณภาพที่ได้จากการสแกนเนอร์แบบนี้สูงกว่า
โปรแกรมรู้จำัตัวอักษร
การทำงานของโปรแกรมรู้จำตัวอักษร หรือ OCR ย่อมาจาก Optical Character Recognition
เมื่อสแกนเนอร์อ่านข้อมูลจากภาพของเอกสาร มันจะเปลี่ยนข้อมูลนี้ให้อยู่ในรูปแบบ บิตแมป ซึ่งเป็นเมตริกซ์ของพิกเซล มีค่า 2 ค่า คือ ปิด (ขาว) และ เปิด(ดำ) ซึ่งจะทำให้ภาพที่ได้มีความคมชัดลดลงไปซึ่งผลกระทบในจุดนี้ทำให้เกิดปัญหากับซอฟต์แวร์OCR พอสมควร
โปรแกรม OCR จะอ่านบิตแมปที่สร้างโดยสแกนเนอร์ และเฉลี่ยพื้นที่ที่ปิดและเปิดของหน้ากระดาษ ซึ่งมีผลต่อพื้นที่สีขาวในหน้ากระดาษด้วย การทำเช่นทำให้ซอฟต์แวร์สามารถแยกองค์ประกอบต่างๆ ไม่ว่าจะเป็นย่อหน้า คอลัมน์ หัวข้อ และกราฟิกอื่นๆ ช่องว่างสีขาวระหว่างบรรทัดในบล็อกจะใช้เป็น baseline ของแต่ละบรรทัดในบล็อก ซึ่งจำเป็นมากในการรู้จำตัวอักษรต่างๆ
ในการเปลี่ยนรูปภาพเป็นข้อความในรอบแรก ซอฟต์แวร์จะพยายามเปรียบเทียบแต่ละพิกเซลกับเท็มเพลตของอักษรที่ซอฟ์แวร์เก็บไว้ในหน่วยความจำ เท็มเพลตนี้ จะมีรูปแบบของอักขระครบทุกแบบ ไม่ว่าจะเป็นตัวอักษร ตัวเลข และสัญลักษณ์ต่างๆ แต่วิธีนี้จะใช้ได้กับภาพตัวอักษรที่ใกล้เคียงกับตัวอย่างมาก ถ้าภาพที่ได้จากการสแกนมีคุณภาพไม่เพียงพอจะทำให้การตีความอักษรผิดพลาดได้
ตัวอักษรอื่นที่ไม่สามารถตีความได้ว่าเป็นตัวอักษรใด จำเป็นต้องผ่านกระบวนการที่ใช้เวลาในการประมวลผลมากกว่า เรียกว่า Feature Extraction ซอฟต์แวร์จะคำนวณความสูงของอักขระตัวเล็กและวิเคราะห์องค์ประกอบของตัวนั้น เช่น เส้นตรง เส้นโค้ง และพื้นที่ปิด ซึ่งซอฟต์แวร์จะมีข้อมูลเหล่านี้อยู่ในตัวมันเองอยู่แล้วว่าตัอักขระตัวใดมีลักษณะเป็นอย่างไร แล้วจึงตีความว่าตัวขระนั้นน่าจะเป็นตัวอะไร และจะเก็บไว้ใช้ต่อไป เมื่อมีการพบรูปอักขระเดิมการวิเคราะห์จะทำได้เร็วขึ้น
เนื่องจากทั้งสองกระบวนการนี้ไม่สามารถตีความได้ทุกตัวอักษร ซอฟต์แวร์บางตัวจะจัดการกับตัวอักขระที่ตีความไม่ได้ให้เป็น ตัวอักขระแบบพิเศษ เช่น #, @, ~ เป็นต้น คุณจำเป็นต้องหาอักขระที่ถูกต้องด้วยตัวคุณเอง ซอฟต์แวร์บางตัวก็จะขึ้นรูปตัวอักขระแล้วถามว่าตัวนี้ไม่รู้จักจะให้ตีความเป็นอักขระใด
โปรแกรม OCR บางตัวจะเรียกใช้ฟังก์ชันตรวจคำผิดเพื่อหาข้อผิดพลาดอย่างชัดแจ้งและแก้ไขให้โดยอัตโนมัติ และซอฟต์แวร์ส่วนใหญ่จะมีความสามารถเปลี่ยนเอกสารที่ได้นี้ให้สามารถใช้งานได้โดย โปรแกรม Word processor ที่นิยมใช้งานทั่วไปให้โดยอัตโนมัต
