30
วารสาร
กรมวิ
ทยาศาสตร์
บริ
การ
Big Data
คือ ?
คือ ?
ปั
จจุ
บั
นที่
โลกถู
กขั
บเคลื่
อนด้
วยข้
อมู
ลผู้
คนต้
องพึ่
งพิ
ง
ข้
อมู
ลในการตั
ดสิ
นใจต่
างๆกระบวนการคิ
ดของคนทั่
วไปหรื
อ
แม้
แต่
องค์
กรต่
างๆ ในทุ
กวั
นนี
้
ส่
วใหญ่
อยู
่
บนฐานของการรวบรวม
ข้
อมู
ลประมวลผลเพื
่
อประกอบการตั
ดสิ
นใจทำ
�อะไรบางอย่
าง
แต่
ด้
วยความที
่
ข้
อมู
ลในปั
จจุ
บั
นมี
อยู
่
มากมายและกระจั
ดกระจาย
คำ
�ถามสำ
�คั
ญ คื
อ เราจะเข้
าถึ
งข้
อมู
ลมหาศาลเหล่
านั้
นและใช้
ข้
อมู
ลเหล่
านั
้
นให้
เป็
นประโยชน์
ได้
อย่
างไรจากคำ
�ถามดั
งกล่
าว
จึ
งทำ
�ให้
คนหั
นมาสนใจสิ่
งที่
เรี
ยกว่
า Big data กั
นมากขึ้
นจน
กลายเป็
นกระแสสั
งคมในปั
จจุ
บั
น
What is big data?
Big data คื
อ ข้
อมู
ลที่
ประกอบด้
วยคุ
ณลั
กษณะ 4 อย่
างคื
อ
1. Volume—size ของข้
อมู
ลมี
ขนาดใหญ่
มี
ปริ
มาณ
ข้
อมู
ลมาก ซึ่
งสามารถเป็
นได้
ทั
้
งข้
อมู
ลแบบ offline หรื
อ online
2. Variety—ข้
อมู
ลมี
ความหลากหลาย สามารถเป็
นได้
ทั้
งที่
มี
โครงสร้
างและข้
อมู
ลที่
ไม่
สามารถจั
บ pattern ได้
3. Velocity—ข้
อมู
ลมี
การเปลี่
ยนแปลงตลอดเวลาอย่
าง
รวดเร็
ว มี
การส่
งผ่
านข้
อมู
ลอย่
างต่
อเนื่
องในลั
กษณะ streaming
ท�
ำให้
การวิ
เคราะห์
ข้
อมู
ลแบบ manual มี
ข้
อจ�
ำกั
ด
4. Veracity—ข้
อมู
ลมี
ความไม่
ชั
ดเจน (untrusted,
uncleaned)
รู
ปแบบของข้
อมู
ลของ big data สามารถเป็
นไปได้
หลากหลาย
ตั้
งแต่
1. Behavioral data: ข้
อมู
ลเชิ
งพฤติ
กรรมการใช้
งาน
ต่
างๆ เช่
น server log, พฤติ
กรรมการคลิ
กดู
ข้
อมู
ล, ข้
อมู
ลการ
ใช้
ATM เป็
นต้
น
Sci
en
ce
สไตล์
สนุ
ก
กนกวรรณ กรองแก้ว
นักวิทยาศาสตร์
สำ�นักพัฒนาศักยภาพนักวิทยาศาสตร์ปฏิบัติการ