จากหัวข้อแรกในงาน Code Mania 1010 :: All about passion
ช่วง keynote speaker นั้น
พูดในหัวข้อ Toward Virtual People: A Case Study on Fake Obama
เป็นการพูดถึงโลกและเทคโนโลยีมีการปรับปรุงและเปลี่ยนไปอย่างมาก
ยิ่งในโลกของ AI (Artificial intelligence), Computer vision และ ML (Machine Learning)
แน่นอนย่อมมันทั้งข้อดีและข้อเสีย
โดยเรื่องนี้ผมเคยดูและฟังมาน่าจะ 2 ครั้งแล้ว (ยังชอบเสมอ)
สามารถดูผ่าน TED :: Fake videos of real people -- and how to spot them
ส่วนตัวอย่างของ Fake Obama ก็จาก BBC News ได้เลย ชัดมาก ๆ
ใน VDO :: Fake Obama created using AI video tool - BBC News
แต่สิ่งที่ผมสนใจมาก ๆ คือ อนาคตของงานและการวิจัย
ว่าจะไปทิศทางไหนบ้าง ?
โดยผู้พูดได้แนะนำไว้ว่า
ในอนาคตเราต้องการสิ่งที่ interact กับเราได้เหมือนมนุษย์ด้วยกันมากขึ้น
บางครั้งคิดว่าเป็นการ interact กับมนุษย์ไปเลย
ซึ่งนั่นคือ การพูดคุยแบบเห็นหน้าเห็นตา
มากกว่าข้อความและเสียง
ดังนั้นเรื่องของ Virtual Reality
จึงน่าจะเป็นสิ่งที่น่าจะเกิดขึ้นและสำคัญมาก ๆ
ยกตัวอย่างของงานวิจัยและงานที่มีบริษัททำออกมาขายแล้ว เช่น
- การเปลี่ยนปากของผู้พูดใน VDO/หนัง ให้เป็นไปตามภาษาของแต่ละประเทศ
- การสร้าง VDO ต่าง ๆ จากรูปภาพ
- การลองเสื้อผ้าแบบ reality มากขึ้น
อีกอย่างที่ผู้พูดอยากให้มีเยอะ ๆ ในเมืองไทย คือ
เรื่องของความรู้ความเข้าใจเกี่ยวกับ Computer Vision
นั่นคือ การสนใจในปัญหาเกี่ยวกับการมองเห็นของ computer
แน่นอนว่า ปัญหาหลัก ๆ คือ
การสอนให้ computer เข้าใจการมองเห็นตามมุมมองของมนุษย์ (Machine Learning)
เนื่องจากปัญหานี้นั้น
ทาง Computer Vision นั้นยังเหมือนเด็ก
นั่นคือ ยังไม่มีความรู้และเข้าใจเหมือนมนุษย์
จึงทำให้ผลการทำงานผิดพลาดบ่อยมาก ๆ (Overfitting problem)
เรื่องของ Computer Vision มีเยอะมาก ๆ
ยกตัวอย่างเช่น
- Image recognition
- Image segmentation
- Image captioning
- 3D understanding คือการทำความเข้าใจหรือรู้จักในมุมมองต่าง ๆ
Computer จะเก่งมาก ๆ
แต่ปัญหาใน Computer Vision ก็ยังกว้างและมีปัญหามากมาย
นั่นคือ Teach computer to imagine
จะสอนให้ computer สามารถจินตนาการได้อย่างไร ?
ทั้งเรื่องของ Image generation
ทั้งเรื่องของ Music generation
ทั้งเรื่องของ Image inpainting (เพิ่มเติมส่วนที่ขาดหายไป)
ทั้งเรื่องของ Style transfer
ทั้งเรื่องของ Image translation และอื่น ๆ อีกมากมาย
เราจำเป็นต้องสอน computer เพื่อให้รู้และเข้าใจ
ด้วยข้อมูลจำนวนมหาศาล เพื่อให้ได้ความรู้และมีความรู้ตามที่ต้องการ
แต่ปัญหาจากสิ่งที่สอนก็อาจจะทำให้เกิด bias ได้เช่นกัน
แต่ก็ขึ้นอยู่กับเป้าหมายของการสอนมากกว่า ว่าต้องการอะไร
สิ่งที่เป็นปัญหาต่อมาของ Computer Vision คือ
นักวิจัยทำการทดลองใส่ noise เข้ายังรูปภาพ
ผลที่ได้คือ computer จะโดนหลอก และทำงานผิดพลาด
ซึ่งทางผู้พูดชี้ให้เห็น ความเปราะบางของการเรียนรู้
ว่าถ้ามีความเปราะบางแบบนี้
อาจจะก่อให้เกิดปัญหาร้ายแรงได้
ยกตัวอย่างเช่น
ใน self-driving car
ถ้าทำการหลอกที่ป้ายความเร็ว ให้ขับเร็วได้ อาจจะก่อให้เกิดอันตรายได้
ในเรื่องของการ scan หน้า
มีการสร้างแว่นพิเศษสำหรับหลอกว่าเป็นคนอื่นได้อีกด้วย
จะเห็นได้ว่า เรื่องต่าง ๆ เหล่านี้ มีทั้งข้อดีและข้อเสีย
แน่นอนว่า ก็ยังต้องคิดค้นและวิจัย เพื่อปรับปรุงกันต่อไป
แต่ด้วยเทคโนโลยีที่ทันสมัย
จึงช่วยทำให้การคิดค้นและวิจัยมีความก้าวหน้าที่สูงมาก ๆ