PHP + MySQL จะเช็ค Duplicated/Similarity Records ยังไง ?

กระทู้คำถาม
โปรเจคเป็น PHP + MySQL นะครับ
หลักการคือ
จะมีระบบ import CSV file เข้าไป แล้วตอนจะ Insert to DB นั้น จะไปเช็คข้อมูลในฐานข้อมูลว่าเคยมีหรือยัง
ส่วนของเช็คว่า ซ้ำกันมั้ยเนี่ย... ไม่ยากครับ เช็คว่า compare string ก็ได้
แต่ปัญหาก็คือ
เจ้านาย อยากจะให้เช็คว่า ข้อมูลเดิมมันคล้ายกันมากน้อยแค่ไหน (ไม่ใช่ซ้ำกันนะ)
ตัวอย่างเช่น
Testing Co., Ltd. / Testing Co.,Ltd. / Testing Ltd. / Testing Limited จะถือว่า คล้ายกัน อาจจะเป็นข้อมูลเดียวกัน
หรือ
XYZ (Thailand) Ltd. / XYZ Thailand Ltd. / XYZ Ltd. / XYZ Co.,Ltd. / XYZ Company Limited ก็อาจจะเป็นข้อมูลเดียวกันได้

ลักษณะทำนองนี้น่ะครับ เราจะเขียนโค้ด ตรวจสอบข้อมูลยังไงดีครับ ?
ผมลองใช้ ฟังก์ชั่นของ PHP ที่เป็น similar_text() แต่ก็ได้ผลลัพธ์ไม่ค่อยเวิร์คเท่าไหร่

ใครมีวิธีบ้างครับ? ช่วยแนะนำหน่อยได้มั้ยครับ
แสดงความคิดเห็น
โปรดศึกษาและยอมรับนโยบายข้อมูลส่วนบุคคลก่อนเริ่มใช้งาน อ่านเพิ่มเติมได้ที่นี่