ในสมัยสงครามโลกครั้งที่สอง การสื่อสารเป็นเรื่องสำคัญของการสั่งการและประสานงานการรบ ฝ่ายสัมพันธมิตรได้ทำการค้นคว้าวิจัยและหาทางถอดรหัสลับที่ทางกองทัพเยอรมันใช้ติดต่อกัน
รหัสลับที่ส่งเป็นรหัสตัวหนังสือผ่านระบบโทรเลข หรือเป็นรหัสมอร์สที่แทนตัวอักษร แต่มีลำดับเรียงกันไป เยอรมันเข้ารหัสด้วยเทคนิคต่าง ๆ การถอดรหัสสายตัวอักขระเพื่อแยกแยะว่าข้อความที่เยอรมันส่งมีข้อความอย่างไร
อลัน ทัวริ่ง (Alan Turing) เป็นบุคคลหนึ่งที่ศาสตร์วิชาทางคอมพิวเตอร์ยกย่องมาก อลัน ทัวริ่ง เสนอวิธีคิดการคำนวณแบบเครื่องจักรลำดับ (Turing Machine) เพื่อใช้ในการถอดรหัสข้อความของเยอรมัน ทฤษฎีเครื่องจักรลำดับเป็นการคำนวณแบบลำดับจากข้อมูลที่เป็นสายวลี (String data) หลักการดังกล่าวนี้เป็นศาสตร์พื้นฐานที่ถือได้ว่าเป็นแนวคิดที่สำคัญและพัฒนาเป็นรากฐานที่สำคัญของคอมพิวเตอร์ในยุคต่อมา
ปัจจุบันพัฒนาการทางคอมพิวเตอร์เจริญก้าวหน้าไปไกลมาก ขีดความสามารถเชิงการคำนวณทำได้มาก ซีพียูยุคปัจจุบันสามารถคำนวณตัวเลขได้หลายร้อยล้านครั้งในเวลาหนึ่งวินาที จากประสิทธิภาพที่ดีขึ้นมากของคอมพิวเตอร์ ประจวบกับการสร้างเครื่องมือเพื่อศึกษาสิ่งมีชีวิตในระดับโมเลกุลได้มากขึ้น การผสมผสานศาสตร์ทางด้านคอมพิวเตอร์กับชีววิทยาจึงเกิดขึ้น โดยเฉพาะอย่างยิ่งการถอดรหัสพันธุกรรม ซึ่งมีข้อมูลทางพันธุกรรมมากมายที่จะต้องถอดรหัส และต้องใช้ขีดความสามารถเชิงการคำนวณและเทคนิคที่สูงตามด้วย ข้อมูลทางพันธุกรรมและขยายการวิธีการที่เกี่ยวกับการประมวลผล จึงเป็นที่มาของศาสตร์แขนงใหม่ที่กำลังได้รับความสนใจ และจะเป็นประโยชน์ต่อชาวโลกมหาศาล คือ ไบโออินฟอร์มาติกส์ (Bioinformatics)
สายรหัสพันธุกรรมของมนุษย์ (human genome) เป็นสิ่งที่ท้าทายความสามารถมาก เพราะประกอบด้วยหน่วยย่อยทางเคมีระดับโมเลกุล ที่เรียงต่อกันยาวถึง 3 พันล้าน ลองนึกดูว่าเรามีรหัสข้อมูลขนาด 3 พันล้านหน่วยที่ต้องถอดรหัสด้วยคอมพิวเตอร์ งานระดับนี้จึงเกี่ยวโยงกับศาสตร์คอมพิวเตอร์มากมายที่จะต้องพัฒนาตาม
การถอดรหัสพันธุกรรม เป็นเรื่องที่สำคัญและจะให้ประโยชน์แก่มวลมนุษย์ชาติมหาศาล อีกทั้งมีมูลค่าทางการค้ามาก เพราะรหัสพันธุกรรมที่ได้เกี่ยวข้องกับการรู้ถึงการเกิดโรค การเกี่ยวพันกับการสร้างยารักษาโรค การปรับปรุงพันธุ์ การโคลนนิ่ง ตลอดจนการใช้ประโยชน์ในเรื่องการสร้างอาหาร และปัจจัยสี่อื่น ๆ
เมื่อความสำคัญของไบโออินฟอร์เมติกส์มีมาก อุตสาหกรรมและองค์กรเอกชนหลายแห่ง รวมถึงองค์กรภาครัฐต่าง ๆ ที่ไม่มุ่งการค้าได้ทำการศึกษาวิจัย ข้อมูลทางพันธุกรรมนี้จะมีค่ามากมาย เชื่อกันว่า ภายในปี 2005 มูลค่าของข้อมูลในตลาดที่ทำการค้าซื้อขายข้อมูลทางพันธุกรรมนี้จะมีค่ากว่า 2 พันล้านเหรียญสหรัฐ
กลุ่มที่ทำการศึกษาและทำการเก็บข้อมูลสายพันธุกรรมมนุษย์มีสองกลุ่ม และได้ดำเนินการมาแล้วกว่าสิบปี กลุ่มแรกคือ
โครงการฮิวแมนจีโนม
(Human Genome Project)
ส่วนกลุ่มที่สองคือ บริษัท ซีลีรา จีโนมิกส์ Celera Genomics
โครงการฮิวแมนจีโนม เป็นโครงการระหว่างประเทศที่ร่วมมือกันทำงานหลายองค์กร โดยใช้เงินลงทุนรวมเป็นเงินกว่าสามพันล้านเหรียญ ในตลอดระยะเวลาสิบห้าปีที่ผ่านมา โดยช่วยกันทำการจัดทำข้อมูลสายรหัสพันธุกรรม และรวบรวมเก็บเป็นฐานข้อมูลกลางที่เรียกเข้าถึงหรือดาวน์โหลดมาปรับปรุงข้อมูลและใช้ร่วมกัน การเก็บฐานข้อมูลจัดดำเนินการโดย National Center for Biotechnology Information (ที่สหรัฐอเมริกา) สำหรับที่ยุโรปดำเนินการเก็บรวบรวมข้อมูลที่ European Bioinformatics Institute ส่วนที่ญี่ปุ่นเก็บไว้ที่ DNA Data Bank สำหรับบริษัท ซีลีรา มีฐานข้อมูลที่จัดทำขึ้นโดยบริษัท ซึ่งบริษัทเป็นผู้รับทำข้อมูลให้กับบริษัทผลิตยา และบริษัทที่ทำธุรกิจทางด้านไบโอเทคโนโลยีอื่น ๆ อีก
ที่สำคัญยิ่งและได้รับการจดบันทึกไว้ในประวัติศาสตร์คือ ราวเดือนพฤษภาคม ปี ค.ศ. 2000 บริษัท ซีลีรา ประกาศความสำเร็จในการสร้างฐานข้อมูลรหัสพันธุกรรมของมนุษย์ได้สำเร็จ ซึ่งเร็วกว่าที่คาดไว้ ทั้งนี้เพราะระบบซูเปอร์คอมพิวเตอร์ที่บริษัทใช้ทำงานได้ดีกว่าที่ตั้งเป้าหมายไว้มาก โดยบริษัทจะจัดทำข้อมูลได้สำเร็จสมบูรณ์ และสามารถเผยแพร่ได้ในปี ค.ศ. 2001 นี้ ส่วนของโครงการฮิวแมนจีโนมจะได้เวอร์ชันที่สมบูรณ์ในปี ค.ศ. 2003

รูปที่ 1 ภาพวาดจินตนาการของสายรหัสพันธุกรรมในระดับโมเลกุล
ที่มา
: http://www.blc.arizona.edu/
ทำความรู้จักกับความรู้พื้นฐาน DNA
จากการศึกษาสิ่งมีชีวิตพบว่า หน่วยชีวิตเล็ก ๆ เรียกว่า เซลล์ เซลล์เป็นหน่วยหนึ่งที่ทำหน้าที่หรือทำกิจกรรมต่าง ๆ มีการแบ่งเซลล์ เซลล์ใหม่จะได้รับการถ่ายทอดลักษณะทางพันธุกรรมมาจากเซลล์เดิม
ภายในเซลประกอบด้วยส่วนที่อยู่ภายในที่สำคัญเรียกว่า นิวเคลียส ภายในนิวเคลียสมีสารที่สำคัญที่ทำหน้าที่ควบคุมโครงสร้างการทำงานของสิ่งมีชีวิต และถ่ายทอดทางพันธุกรรมเรียกว่า โครโมโซม โครโมโซมมีลักษณะเป็นเส้นยาวขดไปขดมาเต็มไปหมด สำหรับของคนมีโครโมโซมอยู่ 23 คู่ (46 แท่ง) ในสิ่งมีชีวิตต่าง ๆ จะมีจำนวนแท่งโครโมโซมไม่เท่ากัน
แท่งโครโมโซมที่เป็นสายยาวประกอบด้วย กรดนิวคลีอิก ชนิดดีออกซีไรโบ นิวคลีอิก (Deoxyribonuclic acid) เรียกย่อ ๆ ว่า DNA DNA เป็นสารพันธุกรรมที่มีโปรตีนเป็นองค์ประกอบ หน้าที่ของโครโมโซมมีหน้าที่ควบคุมกระบวนการต่าง ๆ ในสิ่งมีชีวิต ควบคุมลักษณะและการถ่ายทอดลักษณะกรรมพันธุ์ต่าง ๆ
หัวใจของลำดับรหัสพันธุกรรมอยู่ที่โครงสร้างระดับโมเลกุลที่จับตัวของสาร DNA ซึ่งประกอบด้วยโครงสร้างทางเคมี 4 แบบ ซึ่งได้แก่ อะดีนีน (Adenine) ไทมีน (Thymine) กัวนีน (Guanine) และไซโตซีน (Cytosine) หรือเรียกย่อ ๆ ว่า A T G C ซึ่งสารนี้จะจับตัวกับโมเลกุลของน้ำตาลดีออกซีริโบส กับโมเลกุลของฟอสเฟส ทำให้ได้โครงสร้างเป็นหน่วยหน่วยหนึ่งเรียกว่า นิวคลีโอไทด์ (ดูรูปที่ 1)
นิวคลีโอไทด์จึงเป็นแกนหลักของ DNA ประกอบเป็นสายยาว และอยู่ร่วมกันเป็นสายคู่ และม้วนพันกันเสมือนเป็นคั่นบันได โดยมีสองคั่นบันไดม้วนซ้อนอีก แต่ละขั้นบันไดที่จับตัวของ DNA จะประกอบด้วยโมเลกุลทางเคมีของหน่วย A T G และ C ซึ่งประกอบในนิวคลีโอไทด์ โดยที่แต่ละหน่วยของนิวคลีโอไทด์ที่เป็นโมเลกุลของ A T G หรือ C เรียกว่า เบส (Base) การจับกันของเบสเป็นคู่ลำดับที่เรียกว่า เบสแพร (Base pair) โดย A จะอยู่กับ T และ G อยู่กับ C
ลำดับเบส จึงเป็นส่วนสำคัญของโครโมโซม ซึ่งถ้าเรียงลำดับเบสก็จะได้สายอักขระตัวอักษร A T G C ยาวมากมาย ลำดับเบสนี้บางส่วนเท่านั้นที่มีลักษณะสำคัญที่สามารถสั่งการควบคุมการทำงานของสิ่งมีชีวิต และถ่ายทอดอกมาเป็นลักษณะทางพันธุกรรม กลุ่มของลำดับเบสมีลักษณะเป็นโปรตีนที่สร้างฟังก์ชันการทำงานของร่างกาย และเป็นประตูรับคำสั่งเพื่อดำเนินกรรมวิธีต่าง ๆ จึงเป็นส่วนที่สำคัญที่นักวิทยาศาสตร์ต้องเรียนรู้และเข้าใจว่าลำดับเบสส่วนใดมีฟังก์ชันและหน้าที่อย่างไร
นักวิทยาศาสตร์มีความเพียรพยายามที่จะศึกษาและทำความเข้าใจในลำดับสายรหัสพันธุกรรม จากการศึกษาและเข้าใจโครงสร้างทางโมเลกุล ทำให้สามารถแยกส่วนของ DNA บางส่วนออกมา และทำการหาสายรหัสพันธุกรรม โดยไม่ต้องทำทีเดียวทั้งหมด ลักษณะดังกล่าวเป็นการคัดลอกบางส่วนของยีน โดยเป็นหลักการที่สำคัญของเครื่องมือวิทยาศาสตร์ที่เรียกว่า DNA Sequencing การคัดลอกนี้จะคัดลอกออกมาด้วยความยาวเท่าใดก็ได้ ดังนั้นจึงสามารถใช้เครื่องหาลำดับ DNA นี้ หลาย ๆ เครื่อง ในห้องปฏิบัติการและช่วยกันทำ ซึ่งต้องใช้เวลามาก สำหรับการหาลำดับ DNA ของมนุษย์นั้นได้เริ่มทำมาตั้งแต่ปี 1990 จนถึงปี 2000 ที่บริษัท ซีลีรา ประกาศความสำเร็จ
ข้อมูลของลายพิมพ์รหัสพันธุกรรมที่จัดทำขึ้น
จึงเป็นฐานข้อมูลที่จะใช้วิเคราะห์และสร้างความรู้ที่เกี่ยวข้องกับสิ่งมีชีวิต
นับเป็นเรื่องที่ท้าทายความสามารถที่จะไขลายพิมพ์ที่สร้างขึ้นจากดีเอ็นเอให้กระจ่าง
------->มีต่อตอนที่ 2 ฉบับหน้า
เอกสารอ้างอิง
1. Samuel K. Moore "Understanding the human genome" IEEE Spectrum Vol.37 No.11, Nov. 2000.
|