ข้อมูลที่จัดเป็น บิ๊กดาต้า ประกอบด้วยข้อมูลอะไรบ้าง คุณสมบัติของ Big Data นั้น จะมีลักษณะโดยรวมอยู่ 6 ประการด้วยกัน หรือที่มีการพูดถึงในชื่อ “5Vs 1C” โดยคุณลักษณะทั้ง 6 ของ Big Data นั้น มีดังนี้

1. ข้อมูลที่มีปริมาณมาก (Volume)

หมายถึง มีปริมาณข้อมูลอยู่มาก มีขนาดใหญ่ สามารถนับรวมได้ทั้งข้อมูลแบบออนไลน์และแบบออฟไลน์ โดยข้อมูลต้องมีขนาดใหญ่เกินกว่า Terabyte

ยกตัวอย่างเช่น การเข้าถึงอินเทอร์เน็ตของประชากรทั่วโลกที่มีจำนวนเพิ่มมากขึ้นทุกปี ซึ่งแต่ละคนมีพฤติกรรมการใช้งานข้อมูลที่หลากหลาย ทำให้ปริมาณของข้อมูลที่เกิดขึ้นมีจำนวนมหาศาล

2. ข้อมูลที่มีความหลากหลาย (Variety)

หมายถึง ข้อมูลแต่ละชนิดนั้นมีความหลากหลาย รวมกันทั้งรูปแบบมีโครงสร้าง ไม่มีโครงสร้าง และกึ่งโครงสร้าง

ยกตัวอย่างผ่านพฤติกรรมของ Social Media User ที่ในแต่ละวันสามารถสร้างชุดข้อมูลได้หลากหลาย เช่น การคอมเมนต์ลงในโพสต์ทาง Facebook จัดเป็นข้อมูลแบบไม่มีโครงสร้าง เพราะไม่สามารถคาดเดาคำตอบและโพสต์ที่เขาสนใจจากคอมเมนต์ได้

หรือการโพสต์ลงบน Twitter ที่สามารถจัด Category ของแต่ละโพสต์ผ่าน Hashtag ได้ แต่ก็ไม่สามารถระบุโครงสร้างหรือความหมายของ Hashtag นั้นได้อย่างชัดเจน นี่จึงจัดเป็นข้อมูลกึ่งโครงสร้าง

ส่วนข้อมูลที่ได้จากการตอบแบบสอบถามผ่าน Google Form ที่มีคำถามและคำตอบให้เลือกอย่างชัดเจน และข้อมูลนั้นสามารถนำไปใช้ต่อได้เลยทันที จะจัดว่าเป็นชุดข้อมูลแบบมีโครงสร้าง

เนื่องจากการใช้งานของ Social Media User นั้นไม่ได้เป็นระเบียบแบบแผนตายตัว ทำให้นอกจากมีปริมาณข้อมูลเกิดขึ้นอย่างมหาศาลแล้ว ข้อมูลเหล่านั้นยังเต็มไปด้วยความหลากหลายและซับซ้อนอีกด้วย

3. ข้อมูลที่มีการเพิ่มขึ้นอย่างรวดเร็ว (Velocity)

หมายถึง ข้อมูลที่มีการเพิ่มขึ้นและเกิดความเปลี่ยนแปลงอย่างรวดเร็ว ทำให้เกิดข้อมูลแบบ Real-time มากมาย อย่างเช่นข้อมูลการจราจร ซึ่ง Google Map ก็ได้ใช้ประโยชน์จากการเข้าถึง GPS ของผู้ที่สัญจรไปมาบนท้องถนน เพื่อวิเคราะห์และนำเสนอเส้นทางที่การจราจรคล่องตัวที่สุดให้กับผู้ใช้งาน

4. ข้อมูลที่สร้างประโยชน์นำไปใช้ในทางธุรกิจได้ (Value)

หมายถึง ข้อมูลที่มีคุณค่าต่อการนำไปใช้งาน สามารถก่อให้เกิดประโยชน์ทางธุรกิจได้เป็นอย่างดี ยกตัวอย่างเช่น พฤติกรรมการค้นหาข้อมูลผ่าน Google ที่ทำให้สามารถทราบถึงความสนใจของผู้คนในช่วงเวลานั้นๆ ได้

5. ข้อมูลต้องมีความถูกต้องชัดเจน (Veracity)

เนื่องจาก Big Data นั้นรวบรวมข้อมูลไว้เป็นจำนวนมหาศาล เพราะฉะนั้น สิ่งที่สำคัญที่สุดก็คือความถูกต้องชัดเจนของข้อมูล ซึ่งจะเป็นส่วนสำคัญที่จะสามารถนำข้อมูลเหล่านั้นมาประมวลผลเพื่อการใช้งานต่อในอนาคตได้

6. ข้อมูลต้องมีความเชื่อมโยงกัน (Complexity)

การจะใช้ประโยชน์จาก Big Data ได้นั้น มีอีกหนึ่งปัจจัยสำคัญนั่นก็คือความเชื่อมโยงกันของข้อมูล หากสิ่งที่รวบรวมมานั้นไม่สามารถหาจุดเชื่อมโยงกันได้ ข้อมูลเหล่านั้นก็ไร้ประโยชน์ การเก็บ Data ที่มีประสิทธิภาพนั้นจึงต้องคำนึงถึงความสัมพันธ์กันของข้อมูลด้วย

ข้อมูลที่จัดเป็น Big Data ประกอบด้วยข้อมูลอะไรบ้าง

-ข้อมูลประเภทมีรูปแบบและโครงสร้าง เช่น ข้อมูลด้านตัวเลข สถิติ สามารถบอกแจ้งอย่างเป็นรูปธรรม เป็นจำนวนหรือปริมาณวัดได้

-ข้อมูลประเภทนามธรรม ไม่ได้มีโครงสร้างหรือรูปแบบ ข้อมูลกลุ่มนี้ อาจเป็นข้อมูลการสนทนาโต้ตอบ การสร้างปฏิสัมพันธ์ในสังคมโซเชียล อย่าง Facebook , instragram, twitter หรือแม้กระทั่งในรูปแบบของวิดีโอ

-ข้อมูลที่เป็น Big Data เป็นข้อมูลดิบ อาจเป็นข้อมูลตรงขององค์กร หรือได้รับจากภายนอกที่องค์กรมีปฏิสัมพันธ์ด้วย เช่น กลุ่มคู่ค้า เครือข่ายเน็ตเวิร์ค แต่สิ่งที่เหมือนกันก็คือ ข้อมูลเหล่านั้น ต้องนำมาวิเคราะห์ก่อนนำไปใช้สร้างมูลค่าทางธุรกิจ