การประมวลผลภาษาธรรมชาติ (Natural Language Processing)#

ข้อมูลที่เป็นข้อความเป็นแหล่งของข้อมูลที่ทั้งมีความสำคัญ และมีความท้าทายในการวิเคราะห์ ข้อมูลที่เป็นข้อความเป็นผลมาจากแพลตฟอร์มต่าง ๆ ที่คนสามารถพิมพ์ลงไปได้อย่างอิสระ เช่น โซเชียลมีเดีย หรือมาจากองค์กรที่ต้องประกาศหรือมีการแถลงการณ์เรื่องผลประกอบการ กฏระเบียบ หรือมาจากหนังสือ สิ่งพิมพ์ ข้อมูลจากแหล่งเหล่านี้มีปริมาณมากและมีประโยชน์มากหากเราสามารถวิเคราะห์ได้โดยอัตโนมัติเพื่อทำความเข้าใจพฤติกรรม ความคิดเห็นของคน หรือนำมาเป็นแอพพลิเคชันที่มีสามารถเข้าใจภาษามนุษย์ได้ เทคโนโลยีที่ใช้ในการวิเคราะห์ภาษาโดยอัตโนมัติเรียกว่า การประมวลภาษาธรรมชาติ (Natural Language Processing) หรือ NLP ซึ่งเป็นสาขาหนึ่งของปัญญาประดิษฐ์ ในบทนี้เราจะพูดถึงหลักการและวิธีการใช้เครื่องมือต่าง ๆ ทางด้าน NLP ที่เราสามารถเข้าถึงได้ง่ายจากคอมพิวเตอร์ส่วนตัวในปัจจุบัน