DATA คือ ชุดข้อมูลที่เกี่ยวข้องกับสิ่งต่างๆไม่ว่าจะเป็น คน สัตว์ สิ่งของ ที่อยู่ในรูปแบบที่เหมาะสมกับการสื่อสาร การแปลความหมาย และการประมวลผล ซึ่งข้อมูลอาจจะได้มาจาก การสังเกต การรวบรวม การวัดข้อมูล ซึ่ง ประเภทของข้อมูล เราจะสามารถแบ่งออกได้เป็น 3 ประเภท ได้แก่
Structured Data คือ ข้อมูลแบบมีโครงสร้าง เป็นข้อมูลที่ถูกจัดเก็บไว้ในรูปแบบที่ชัดเจน สามารถนำไปใช้ได้อย่างง่ายๆ ข้อมูลที่อยู่ในรูปแบบของไฟล์ เช่น csv หรือ excel file ข้อมูลเหล่านี้ส่วนใหญ่จะอยู่ในรูปแบบของตาราง มีแถว มีคอลัมน์ สามารถเข้าใจถึงความหมายของข้อมูลได้ทันที และสามารถนำไปจัดเรียงลงฐานข้อมูล และจัดการข้อมูลผ่าน SQL ได้
Unstructured Data คือ ข้อมูลที่ไม่มีโครงสร้างที่ชัดเจน เช่น ภาพ เสียง วีดีโอ หรือ ข้อความที่คุยกันในโลกออนไลน์ เนื่องจากในยุคนี้เป็นยุคของ ระบบเครือข่ายและเครื่องมือ เช่น สมาร์ทโฟน ทำให้พฤติกรรมของมนุษย์สร้างข้อมูลที่เป็น Unstructured data อย่างมากมายผ่านทาง Social media และเทคโนโลยีสมัยใหม่ที่ราคาถูกลง ทำให้คนสามารถเข้าถึงข้อมูลประเภทนี้ได้อย่างง่ายดาย
Semi-structured Data ข้อมูลกึ่งโครงสร้าง อยู่ระหว่างกลางของ Structure data และ Unstructured data ซึ่งเป็นข้อมูลที่สามารถนำไปใช้งานได้ง่าย แต่มีความยากในการกำหนดโครงสร้างเพื่อจัดเก็บข้อมูล ข้อมูลประเภทนี้ เอาข้อดีของข้อมูลทั้ง 2 รูปแบบมาคือใช้ตัวอย่างข้อมูลในรูปแบบ Semi-structured data ได้แก่ Hash-tag ตามโลกออนไลน์ซึ่งรูปแบบการเก็บข้อมูลคือจะเป็นโพสต์หรือรูปภาพ แต่เราสามารถดึงมาใช้งานได้ง่ายขึ้นจากการที่เราเลือก Hash-tag ที่เฉพาะเจาะจง
Big Data ก็คือ Data ที่เกิดจาก พฤติกรรมของมนุษย์ที่เปลี่ยนไป ข้อมูลทุกวันนี้เกิดจากมนุษย์สร้างสิ่งเหล่านี้ขึ้นมา ไม่ว่าจะเป็น การเล่น Social media, Online shopping, Mobile Map บริษัทเจ้าของแอพลิเคชั่น เหล่านี้ ได้เก็บข้อมูลทุกอย่างของผู้ใช้ไว้ตลอดเวลา ข้อมูลจึงมีปริมาณมากมายมหาศาล บางทีผู้ใช้ก็ไม่ทันได้สังเกตว่าทุกๆกิจกรรมบนโลกออนไลน์ เรากำลังสร้าง big data อยู่ตลอดเวลา บริษัทที่มีส่วนได้ส่วนเสียในข้อมูลเหล่านี้ ใช้สถิติเพื่อวิเคราะห์ข้อมูลในอดีต ปัจจุบัน เพื่อพยากรณ์อนาคตโดยใช้ data analytics เพื่อช่วยให้เห็นโอกาส การตัดสินใจ ที่มีประสิทธิภาพ สามารถนำผลที่ได้มาสร้างมูลค่าให้กับทางธุรกิจหรือองค์กร
การนำผลลัพธ์ไปใช้ถือเป็นองค์ประกอบสำคัญของ Big Data การนำข้อมูลจากการวิเคราะห์ไปใช้อาจอยู่ในรูปแบบ Data Visualization เช่น ตาราง, กราฟ, แผนที่, Dashboard หรืออาจจะเป็น insight ที่่ตอบคำถามทางธุรกิจ หรือส่งผลต่อการตัดสินใจขององค์กร โดยอยู่บนพื้นฐานของข้อมูลที่มีจำนวนมหาศาล