ก่อนอื่นต้องทำความเข้าใจในเรื่องอินเทอร์เน็ตเล็กน้อย การสื่อสารข้อมูลบนอินเทอร์เน็ตมีรูปแบบที่เรียกว่า ดาต้าแกรม กล่าวคือใช้การสื่อสารแบบแพ็กเก็ต การรับส่งจึงรับส่งด้วยข้อมูลเป็นชุด ๆ เรียกว่า ไอพีแพ็กเก็ต
เมื่อเป็นการสื่อสารแบบดาต้าแกรม เหมือนการส่งจดหมาย ดังนั้นจึงไม่มีการรับประกันเวลา หรือความเร็วในการรับส่ง ข้อมูลที่รับส่งจะถึงเมื่อไรก็ได้ หรือจะสูญหายระหว่างทางก็ได้ แต่จะมีวิธีตรวจสอบว่าได้รับหรือยัง หากยังจะมีการเรียกร้องให้ส่งซ้ำ
การสื่อสารด้วยอินเทอร์เน็ตจึงผ่านเครือข่ายต่าง ๆ มากมาย โดยใช้หมายเลขไอพีเป็นตัวกำหนดแอดเดรสปลายทาง ข้อมูลทุกแพ็กเก็ตจะมีการกำกับแอดเดรสต้นทางและปลายทาง
ปัญหาการใช้งานอินเทอร์เน็ตจึงอยู่ที่ความเร็วของการเรียกข้อมูล ปัญหาความล่าช้านี้มาจากช่องสื่อสารมีขนาดเล็กเกินไป เมื่อมีปริมาณข้อมูลมากก็จะเกิดความล่าช้า และหากแพ็กเก็ตใดไม่ได้รับหรือรับส่งช้า ก็จะมีการเรียกร้องให้ส่งใหม่ ผลลัพธ์ยิ่งทำให้มีปริมาณข้อมูลที่จะส่งมากขึ้น
ประจวบกับช่องทางสื่อสารไปต่างประเทศมีราคาแพงมาก โดยเฉพาะอินเทอร์เน็ตของทุกประเทศ จะต้องไปแลกเปลี่ยนข้อมูลกันที่สหรัฐอเมริกา เส้นทางสื่อสารไปสหรัฐอเมริกาจึงเป็นเส้นทางที่คับคั่ง อีกทั้ง การคิดราคาจะเป็นแบบเต็มวงจร กล่าวคือ วงจรที่ไปสหรัฐอเมริกาที่ใช้เป็นอินเทอร์เน็ต ผู้ใช้ต้องเสียราคาเต็ม แต่หากเป็นวงจรโทรศัพท์ จะเสียค่าใช้จ่ายครึ่งเดียว เพราะทางสหรัฐอเมริกาต้องจ่ายด้วยครึ่งหนึ่ง เพราะระบบ สื่อสารเป็นแบบสองทาง
เมื่อเป็นเช่นนี้บริการอินเทอร์เน็ตในประเทศไทยจึงมีราคาสูง ช่องสื่อสารขนาด 8 เมกะบิต ที่ทบวงใช้ติดต่อไปยังสหรัฐอเมริกาต้องเสียค่าใช้จ่ายถึงปีละกว่าห้าสิบล้านบาท
การเพิ่มประสิทธิภาพบริการอย่างหนึ่งเพื่อให้ผู้ใช้อินเทอร์เน็ตใช้งานได้ด้วยความเร็วสูง และบริหารช่องสื่อสารให้คุ้มค่ายิ่ง จึงเป็นเรื่องของการสร้างบัฟเฟอร์ข้อมูล หรือที่เรียกว่า แคช หรือ พรอกซี่
หลักการของการสร้างบัฟเฟอร์คือ การนำข้อมูลที่ใช้กันบ่อย ๆ และอยู่ต่างประเทศหรืออยู่นอก องค์การ มาเก็บไว้ในองค์กร เพื่อให้สมาชิกขององค์กรเรียกใช้ได้จ่ายรวดเร็ว และลดการใช้ช่องสื่อสารไปต่างประเทศที่มีราคาแพง เพื่อให้ใช้ช่องสื่อสารได้เต็มประสิทธิภาพ

การสร้างแคชเป็นบัฟเฟอร์ข้อมูล

เพื่อให้การบริการผู้ใช้ได้เต็มที่ ระบบบัฟเฟอร์ที่ทางเครือข่ายนนทรีมีจึงได้แก่ ftp.ku.ac.th ซึ่งเป็นที่เก็บข้อมูลที่มักจะดาวน์โหลด ทำให้ผู้ใช้ไม่จำเป็นต้องดาวน์โหลดจากภายนอก และเครื่องที่ทำหน้าที่เป็นแคชข้อมูล หรือ proxy ซึ่งได้แก่ cache1.ku.ac.th , cache2.ku.ac.th และ cache3.ku.ac.th proxy.ku.ac.th
ปริมาณการใช้ข้อมูลและโหลดสูงสุดของการใช้งานเครือข่ายอินเทอร์เน็ตในขณะนี้คือ การเรียกดู ข้อมูลเก็บด้วยโปรโตคอล http และการดาวน์โหลดข้อมูลด้วยโปรโตคอล ftp ดังนั้นการสร้างบัฟเฟอร์จึงเพ่งเล็งไปที่การประยุกต์สองอย่างนี้เป็นหลัก
หลักการของพรอกซี่หรือแคช คือการรับเป็นหน้าที่ติดต่อเรียกข้อมูลให้ เช่น ถ้าผู้ใช้จะติดต่อเว็บ ปกติการติดต่อจะต้องใช้พอร์ตการติดต่อที่ชัดเจน เช่น พอร์ตหมายเลข 80 สำหรับติดต่อเว็บด้วย http ระบบพร๊อกซี่จะติดต่อให้แทน โดยให้ผู้ใช้กำหนดพอร์ตติดต่อกับพร๊อกซี่เป็นพอร์ต 8080 ก่อน เครื่องพร๊อกซี่หรือแคชจะดูว่ามีข้อมูลอยู่ในบัฟเฟอร์ของตนเองหรือไม่ หากมีก็จะส่งข้อมูลให้ทันที หากไม่มีจะเรียกต่อไปปลายทางให้แทน เมื่อได้ข้อมูลจะนำมาเก็บไว้ในบัฟเฟอร์และส่งต่อให้ผู้ใช้ ดังนั้นถ้ามีผู้ใช้รายอื่นเรียกข้อมูลเดียวกันนี้และมีอยู่แล้วก็จะส่งให้ได้ทันที
จากสถิติของเครือข่ายนนทรี พบว่าภายในเครือข่ายนนทรีมีการเรียกดูข้อมูลแบบเว็บมากกว่าล้านครั้งต่อวัน (นับรวมทุกแคช) ดังนั้นระบบแคชจึงช่วยเพิ่มประสิทธิภาพได้มาก
การสร้างประสิทธิภาพของระบบแคช จึงขึ้นอยู่กับจำนวนข้อมูลที่พบบนบัฟเฟอร์ซึ่งเราเรียกว่า hit อัตราการ hit วัดเป็นเปอร์เซ็นต์ เช่น ถ้ามี hit rate 40 เปอร์เซ็นต์ ก็หมายถึงการเรียกร้อยครั้งจะได้ข้อมูลในแคช 40 ครั้ง ปริมาณข้อมูลในแคชนี้ทำให้เสมือนลดปริมาณการเรียกจากภายนอก และผู้ใช้ก็สามารถเรียกได้ข้อมูลเร็ว
อัตราการ hit ขึ้นอยู่กับปริมาณและขนาดของแคช สำหรับเครือข่ายนนทรีเป็นเครือข่ายขนาดใหญ่ มีผู้ใช้จำนวนมหาศาล (เมื่อดูจากแคช) ดังนั้นระบบแคชจึงต้องมีประสิทธิภาพ ขนาดของฮาร์ดดิสค์ในแคชจะทำให้เพิ่มปริมาณการ hit โดยขณะนี้ขนาดของฮาร์ดดิสค์ที่ใช้มีขนาดประมาณ 30 GB ต่อเครื่อง อย่างไรก็ดีถ้าใช้เครื่องแคชเครื่องเดียว ปริมาณการ hit จะสูงขึ้น แต่จะรองรับการ request หรือการเรียกของผู้ใช้ไม่ไหว นโยบายการให้บริการจึงวางแคชไว้ 3 เครื่อง เพื่อแบ่งเบาการเรียกข้อมูล แต่จะทำให้ hit rate ตกลง แต่การปรับแต่งการเรียกข้อมูลภายนอกทำได้เร็วขึ้น
การบริหารจัดการแคชเป็นเรื่องใหญ่ เพราะจะทำให้ประสิทธิภาพการใช้งานได้สูงสุด สำนักบริการคอมพิวเตอร์ได้ให้ความสำคัญในเรื่องแคชอย่างมาก จึงเน้นประสิทธิภาพของเครื่องแคชให้เป็นเครื่องที่มีประสิทธิภาพสูง การเชื่อมต่อกับเครือข่ายไม่มีคอขวด รองรับการรับส่งข้อมูลปริมาณสูงบนเครือข่าย โดยแยกด้วยสวิตช์ความเร็วสูงแบบ 100 เมกะบิต ระบบดิสค์เป็นแบบ RAID 0 ซึ่งทำให้การเขียนอ่านดิสค์เร็วกว่าปกติมาก ระบบแคชยังปรับแต่งให้ความทันสมัยของข้อมูลเป็นไปแบบอัตโนมัติ เพื่อให้ผู้ใช้ได้ข้อมูลที่ทันสมัยอยู่เสมอ
ระบบแคชจึงเป็นหนทางการบริการเครือข่ายให้เต็มประสิทธิภาพยิ่งขึ้น โดยเฉพาะค่าใช้จ่ายในการเชื่อมวงจรไปต่างประเทศสูงมาก จำเป็นต้องบริหารและจัดการอย่างมีประสิทธิภาพ ระบบแคชจึงวางเป็นระดับขึ้น เพื่อให้รองรับการใช้งานในหลาย ๆ ระดับได้
ผู้สนใจอยากดูสถิติการใช้แคชของนนทรีเน็ตสามารถเรียกดูได้จาก http://logs.ku.ac.th

สาระน่ารู้ประจำสัปดาห์, ฉบับที่ 15 : 24 - 30 เมษายน 2543
สำนักบริการคอมพิวเตอร์ มหาวิทยาลัยเกษตรศาสตร์