สิ่งหนึ่งที่สำคัญสำหรับ Big Data คือ ชุดของเครื่องมือต่าง ๆ
ช่วยทำให้การทำงานกับ Big Data ง่ายขึ้น
โดยในปี 2016 เราน่าจะศึกษาสิ่งต่าง ๆ ดังต่อไปนี้บ้างนะ
- Visualization
- Apache Spark
- HBase
- Cask Data Application (CDA)
Visualization
Library ที่ต้องศึกษาเลยก็คือ D3.js นั่นเอง แต่ว่ามันใช้งานยากมาก ถึง มากที่สุด ซึ่งทำให้มีคนสร้าง libary หุ้มมันมาให้ใช้ง่าย ๆ มากมาย มีตัวที่น่าสนใจสำหรับ Big Data คือ NVD3 ซึ่งทำให้ชีวิตง่ายขึ้นเยอะApache Spark และ HBase
เป็น framework ที่ไม่ควรพลาดด้วยประการทั้งปวง สำหรับการประมวลผลข้อมูล และจัดเก็บข้อมูลขนาดใหญ่ แน่นอนว่าในปี 2016 นั้น มันจะมีบทบาทที่สำคัญอย่างมากCask Data Application (CDA)
เป็น abstraction layer ที่ทำงานอยู่บน Apache Hadoop ทำให้การพัฒนาระบบงานมันง่าย และ รวดเร็วมากขึ้น ทั้ง real time และ batch processing แน่นอนว่าสามารถทำงานร่วมกับเครื่องมือเหล่านี้ได้ด้วย- HBase
- Hive
- Tephra คือ Transaction management สำหรับ HBase
- Tigon คือ Real time streaming ด้วย Apache Twill
นักพัฒนา software ลองศึกษากันไว้นะครับ ทั้งเรื่องความรู้พื้นฐานของ Big Data ทั้งเรื่องเครื่องมือต่าง ๆ สำหรับจัดการ และ พัฒนาระบบ