from gensim.models import KeyedVectors
path = '/Users/te/My Drive/workshops/AIS Data Science 2022/DL and NLP Course Material/3 Word embedding/TNC_embeddings-200.bin'
tnc_embeddings = KeyedVectors.load_word2vec_format(path, binary=True, unicode_errors='ignore')
tnc_embeddings.most_similar('คำนึง', topn=10)
/Users/te/anaconda3/lib/python3.11/site-packages/gensim/models/keyedvectors.py:849: RuntimeWarning: invalid value encountered in divide
dists = dot(self.vectors[clip_start:clip_end], mean) / self.norms[clip_start:clip_end]
[('ตระหนัก', 0.6162227988243103),
('หมาย', 0.5812626481056213),
('พิเคราะห์', 0.5239153504371643),
('กล่าวขวัญ', 0.5108522176742554),
('บ่งบอก', 0.5074505805969238),
('แก่กรรม', 0.4906115233898163),
('พิจารณา', 0.4869660437107086),
('ครอบคลุม', 0.48312264680862427),
('เพียงนี้', 0.4765177369117737),
('ระลึก', 0.4564956724643707)]
tnc_embeddings.most_similar('พิจารณา', topn=10)
[('พิเคราะห์', 0.5624943375587463),
('วิเคราะห์', 0.5607314705848694),
('พิจาณา', 0.5489415526390076),
('วินิจฉัย', 0.5258139371871948),
('ดำเนินการ', 0.5139265656471252),
('ITC', 0.5127865076065063),
('ประเมิน', 0.5113678574562073),
('เสนอ', 0.5028934478759766),
('ตีความ', 0.5021229982376099),
('กำหนด', 0.5002379417419434)]
tnc_embeddings.most_similar('บ่งบอก', topn=10)
[('หมาย', 0.6005042791366577),
('บ่ง', 0.5936071872711182),
('แสดง', 0.5531653761863708),
('บ่งชัด', 0.5140919089317322),
('สะท้อน', 0.5108014941215515),
('คำนึง', 0.5074505805969238),
('ระลึก', 0.47053706645965576),
('บ่งชี้', 0.46681541204452515),
('ตระหนัก', 0.4643227756023407),
('กล่าวขวัญ', 0.425353080034256)]
tnc_embeddings.most_similar('นึก', topn=10)
[('เพ้อ', 0.5420231223106384),
('พูด', 0.5370310544967651),
('คิด', 0.5254775285720825),
('บางอ้อ', 0.5175539255142212),
('หลุดปาก', 0.5057739019393921),
('รู้สึก', 0.49102720618247986),
('บอก', 0.4882128834724426),
('ทำไม', 0.4876376688480377),
('รำพึง', 0.47684916853904724),
('เอ่ย', 0.4697892367839813)]
tnc_embeddings.most_similar('อธิบาย', topn=10)
[('บรรยาย', 0.6401349902153015),
('นิยาม', 0.595074474811554),
('ทำนาย', 0.5825995802879333),
('บอกเล่า', 0.5786294341087341),
('วิเคราะห์', 0.5469810366630554),
('ตีความ', 0.5442456007003784),
('เฉลย', 0.524876058101654),
('ชี้แนะ', 0.5192605257034302),
('เข้าใจ', 0.5187632441520691),
('พูด', 0.5179716944694519)]