Computational Linguistics

2209372 & 2209670 ภาษาศาสตร์คอมพิวเตอร์

  • อ. ดร.อรรถพล ธำรงรัตนฤทธิ์
  • Attapol Thamrongrattanarit-Rutherford
  • ภาควิชาภาษาศาสตร์ คณะอักษรศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย
  • Linguistics Department - Faculty of Arts Chulalongkorn University
Python and Unix for NLP

พื้นฐานการเขียนโปรแกรมด้วยภาษา Python และการใช้เครื่องมือ UNIX และการปฏิบัติการบน shell สำหรับผู้ที่ไม่เคยมีพื้นฐานการเขียนโปรแกรมมาก่อน

Machine Learning

เรียนรู้กระบวนการพัฒนาระบบที่ใช้การเรียนรู้ของเครื่อง และประเมินความสามารถของระบบ

Text Classification

Text Classification

ข้อความสามารถถูกจำแนกประเภทตามแต่การใช้งาน เช่น แยกอีเมล์ว่าเป็นอีเมล์สำคัญหรือไม่ กระทู้ที่อ่านนั้นพูดถึงหัวข้ออะไร

Sentiment Analysis

อารมณ์ความรู้สึกสามารถถูกแสดงออกผ่านทางภาษาได้หลากหลายวิธี เทคนิค machine learning ประกอบกับคลังข้อมูลสามารถสอนให้เครื่องวิเคราะห์การแสดงอารมณ์ความรู้สึกได้อย่างแม่นยำ

Basics of Deep Learning

Algorithm ที่สำคัญในการเทรน neural network

Language Modeling

Spell and Grammar Checker

การตรวจแก้การสะกดผิดโดยใช้พจนานุกรมและการเปรียบเทียบคำแบบที่ใกล้เคียงทีสุด

Language Modeling

Language Model คือการใช้คุณสมบัติทางสถิติของภาษาในการคาดเดาคำที่ขาดหายไป สะกดผิด ฟังไม่ชัด หรือแปลผิด หรือขาดแหว่งไปเพราะเหตุผลอื่นๆ

Information Retrieval and Extraction

Information Retrieval

คำค้น และเอกสารที่ต้องการสืบค้นนั้นจะต้องถูกประมวลให้ถูกต้องเพื่อให้การ search มีประสิทธิภาพและรวดเร็ว

Information Extraction

การสกัดความรู้ออกจากข้อความดิบ

Syntactic Parsing

โครงสร้างประโยคเป็นพื้นฐานของการเข้าใจความหมายของประโยค

Language Generation

Machine Translation

Google สามารถแปลภาษาให้เราได้ยังไง โดยใช้คลังข้อมูลคู่ขนานขนาดใหญ่

Sequence-to-sequence model

โมเดลใหม่ ๆ ที่สามารถใช้ generate ภาษาขึ้นมาจากภาษาหนึ่งไปอีกภาษาหนึ่ง หรือจากเสียงเป็นภาษา