การฝึกสอน คอมพิวเตอร์ให้เป็นAi ใช้ชื่อ AI Thai Chat นี้เลยเขียนลงให้โค้ดเลย
Input=txt UI ป้อนข้อมูลข้อความ ให้อ่านหนังสือเยอะ
มีปุ่มเลือกเชื่อมต่ออินเตอร์เน็ต URL
เช่น data.go.th และ
tci-thailand.org
kuir.lib.ku.ac.th
กรอก URL เองได้ให้เชือมต่อการเรียนรู้
เพืออ่านหนังสือข้อความ txt pdf excel และไฟล์ภาพ
มีปุ่มรับไฟล์ภาพ pdf excel
แล้วแปลงเป็นค่าตัวเลข Input=0.0000 และให้สร้างชุดตัวเลข คู่กับคำความหมายของคำนั้นๆ ไฟล์ภาพ
print(ภาพ) ค่ารหัสตัวเลข แกน Y X
print(txt) เก็บความหมายคำ
print(0.0000) เก็บค่าตัวเลข
Save file txt 0.0000 บันทึก ความหมายของคำศัพท์คู่กับค่าตัวเลข json เพื่อสร้างตารางภาษาที่ใช้งาน
มีUI มี อินพุต txt ข้อความยาวๆ ให้อ่าน
มี UI เอาท์พุต txt แสดงข้อความ
การแยก 10 ช่องคือสร้าง LLM
แยกช่องคำศัพท๋ แต่ละช่อง 10ช่อง ถ้าพิมพ์ไม่ครบไม่เป็นไร
และมี UI แสดงผล10ช่องค้นหาค่า 0.0000 0.0000 0.0000
และมี UI แสดงผลพร้อมคำความหมาย10ช่อง txt. txt txt
ระบบ UI ควรมีระบบ Auto-split คือเมื่อผู้ใช้พิมพ์ประโยคยาวๆ ในช่องค้นหาหลัก ให้ระบบกระจายคำศัพท์ลงไปใน 10 ช่องย่อยนี้ให้โดยอัตโนมัติ เพื่อให้ผู้ใช้ไม่ต้องมานั่งพิมพ์แยกทีละช่องด้วยตัวเอง และแก้ไขได้ มีปุ่มกดส่งบันทึก ตรวจคำว่าเชื่อมโยงถูกต้องกันไหมใน 10 ช่อง
สร้าง Ui อินพุดไฟล์ภาพจริง มาแสดงผล ขนาดเล็ก
UI แสดงค่าต้วเลขไฟล์ภาพ ช่องใหญ่หน่อย
Ui แสงความหมาย Ai เข้าในภาพคืออะไร ถ้าไม่รู้ตอบช่วยอธิบายให้หน่อย และแก้ไขได้อธิบายใหม่ให้ถูกต้อง ให้ Ai เข้าใย
มีปุ่ม "ล้างข้อมูลขยะ" (Data Cleaning Filter)
มีปุ่ม ยกเลิกจดจำ ถ้าถูกต้องไม่มีปุ่มกดก็จดจำได้เลย
จดจำการเรียนรู้ เขียนโค้ดไฟล์สมอง Ai บันทึก
ไฟล์โมเดลสมอง (Model Weights): เก็บค่าความสัมพันธ์ของภาษาและการตัดสินใจ (ทำหน้าที่เหมือน ทักษะการคิดของ AI) บันทึกเป็นไฟล์ตระกูล .pt (PyTorch)
ฝึกฝนใช้ภาษาเทรน ช่องอินพุต UI txt จูนค่าตัวเลขหลายครั้งหลายๆรอบ ฝึนหัดสอนภาษาไทยอังกฤษ ฝึกการเชือมคำและความหมาย และรูปภาพ
เพิ่มฟังก์ชันลบแท็ก HTML, ลบสัญลักษณ์พิเศษ (เช่น @, #, *), และแปลงตัวพิมพ์ใหญ่-เล็กในภาษาอังกฤษให้เป็นมาตรฐานเดียวกันก่อนบันทึก
การจัดการพิกัดภาพแกน X Y ในช่องแสดงผลขนาดใหญ่หน่อยคำแนะนำ: เมื่อคุณกำหนดให้มี UI แสดงค่าตัวเลขไฟล์ภาพช่องใหญ่ ตอนที่คุณป้อนไฟล์ภาพเข้าไป ระบบ OCR หรือ CLIP จะมองภาพเป็นตารางพิกัด (Matrix)สิ่งที่คุณควรเพิ่มใน UI: แนะนำให้ใช้เครื่องมือใน Python ที่ชื่อว่า matplotlib หรือ Pillow เพื่อทำ Bounding Box (กรอบสี่เหลี่ยม) บนช่องแสดงภาพขนาดใหญ่ เวลา AI อ่านค่าแกน X Y เจอวัตถุหรือตัวหนังสือ มันจะได้วาดกรอบสีแดงล้อมรอบภาพจุดนั้นให้คุณเห็นบนหน้าจอทันที จะช่วยให้คุณตรวจสอบการเรียนรู้ของ AI ได้ง่ายขึ้นมากครับ4. ลำดับการทำงานของปุ่มล้างขยะ (Data Cleaning Execution Order)คำแนะนำ: ต้องวางลำดับให้ปุ่มนี้ทำงาน ก่อน การแปลงเป็นตัวเลขเสมอ ลำดับที่ถูกต้องคือ:ดึงข้อมูลจาก URL หรืออัปโหลดไฟล์ (PDF/Image)ได้ข้อความดิบมา \(\rightarrow \) *กดปุ่มล้างข้อมูลขยะ (ลบ HTML, ลบ @, #, , ปรับพิมพ์เล็ก)ส่งข้อความที่สะอาดแล้ว ไปตัดคำภาษาไทย (Tokenization)แปลงเป็นค่าตัวเลข 0.0000 แล้วบันทึกไฟล์ มีปุ่มกดเมื่อเทรนเสร็จแล้ว ให้ถอด UI ตอนเทรนออก ให้ใช้ UI ปกติ ซายมือมีปุ่ม สามขีด ช่ือข้อความแชท และมีข้อความตอบกับ และช่องอินพุต txt มีปุ่มกดส่ง txt มีปุ่มเลือกไฟล์
หมายเหตุใครมีไอเดียเพิ่มเติ่มได้ แล้วส่งไปให้ AI เขียนโค้ด ใครเก่งเขียนโค้ดเองก็เขียนตามนี้ได้เลย หรือให้ Ai เขียนจะแก้ไขตามใจชอบได้เลย ยกเว้นชื่อห้ามเปลี่ยน AI Thai chat
ผู้ออกแบบ LAM-Thai (Large Audio Model Thai)
ถ้าผู้ไดคิดจะเอาไปพัฒนาต่อ จงเคารพสิทธิ์ผู้ออกแบบให้ใช้ชื่อ เป็น AI Thai Chat
ลิงก์เชื่อมโยงกัน
https://m.pantip.com/topic/44113140
วิธีสร้าง LLM เทรน AI ใช้ PC ฝึนฝน AI
Input=txt UI ป้อนข้อมูลข้อความ ให้อ่านหนังสือเยอะ
มีปุ่มเลือกเชื่อมต่ออินเตอร์เน็ต URL
เช่น data.go.th และ
tci-thailand.org
kuir.lib.ku.ac.th
กรอก URL เองได้ให้เชือมต่อการเรียนรู้
เพืออ่านหนังสือข้อความ txt pdf excel และไฟล์ภาพ
มีปุ่มรับไฟล์ภาพ pdf excel
แล้วแปลงเป็นค่าตัวเลข Input=0.0000 และให้สร้างชุดตัวเลข คู่กับคำความหมายของคำนั้นๆ ไฟล์ภาพ
print(ภาพ) ค่ารหัสตัวเลข แกน Y X
print(txt) เก็บความหมายคำ
print(0.0000) เก็บค่าตัวเลข
Save file txt 0.0000 บันทึก ความหมายของคำศัพท์คู่กับค่าตัวเลข json เพื่อสร้างตารางภาษาที่ใช้งาน
มีUI มี อินพุต txt ข้อความยาวๆ ให้อ่าน
มี UI เอาท์พุต txt แสดงข้อความ
การแยก 10 ช่องคือสร้าง LLM
แยกช่องคำศัพท๋ แต่ละช่อง 10ช่อง ถ้าพิมพ์ไม่ครบไม่เป็นไร
และมี UI แสดงผล10ช่องค้นหาค่า 0.0000 0.0000 0.0000
และมี UI แสดงผลพร้อมคำความหมาย10ช่อง txt. txt txt
ระบบ UI ควรมีระบบ Auto-split คือเมื่อผู้ใช้พิมพ์ประโยคยาวๆ ในช่องค้นหาหลัก ให้ระบบกระจายคำศัพท์ลงไปใน 10 ช่องย่อยนี้ให้โดยอัตโนมัติ เพื่อให้ผู้ใช้ไม่ต้องมานั่งพิมพ์แยกทีละช่องด้วยตัวเอง และแก้ไขได้ มีปุ่มกดส่งบันทึก ตรวจคำว่าเชื่อมโยงถูกต้องกันไหมใน 10 ช่อง
สร้าง Ui อินพุดไฟล์ภาพจริง มาแสดงผล ขนาดเล็ก
UI แสดงค่าต้วเลขไฟล์ภาพ ช่องใหญ่หน่อย
Ui แสงความหมาย Ai เข้าในภาพคืออะไร ถ้าไม่รู้ตอบช่วยอธิบายให้หน่อย และแก้ไขได้อธิบายใหม่ให้ถูกต้อง ให้ Ai เข้าใย
มีปุ่ม "ล้างข้อมูลขยะ" (Data Cleaning Filter)
มีปุ่ม ยกเลิกจดจำ ถ้าถูกต้องไม่มีปุ่มกดก็จดจำได้เลย
จดจำการเรียนรู้ เขียนโค้ดไฟล์สมอง Ai บันทึก
ไฟล์โมเดลสมอง (Model Weights): เก็บค่าความสัมพันธ์ของภาษาและการตัดสินใจ (ทำหน้าที่เหมือน ทักษะการคิดของ AI) บันทึกเป็นไฟล์ตระกูล .pt (PyTorch)
ฝึกฝนใช้ภาษาเทรน ช่องอินพุต UI txt จูนค่าตัวเลขหลายครั้งหลายๆรอบ ฝึนหัดสอนภาษาไทยอังกฤษ ฝึกการเชือมคำและความหมาย และรูปภาพ
เพิ่มฟังก์ชันลบแท็ก HTML, ลบสัญลักษณ์พิเศษ (เช่น @, #, *), และแปลงตัวพิมพ์ใหญ่-เล็กในภาษาอังกฤษให้เป็นมาตรฐานเดียวกันก่อนบันทึก
การจัดการพิกัดภาพแกน X Y ในช่องแสดงผลขนาดใหญ่หน่อยคำแนะนำ: เมื่อคุณกำหนดให้มี UI แสดงค่าตัวเลขไฟล์ภาพช่องใหญ่ ตอนที่คุณป้อนไฟล์ภาพเข้าไป ระบบ OCR หรือ CLIP จะมองภาพเป็นตารางพิกัด (Matrix)สิ่งที่คุณควรเพิ่มใน UI: แนะนำให้ใช้เครื่องมือใน Python ที่ชื่อว่า matplotlib หรือ Pillow เพื่อทำ Bounding Box (กรอบสี่เหลี่ยม) บนช่องแสดงภาพขนาดใหญ่ เวลา AI อ่านค่าแกน X Y เจอวัตถุหรือตัวหนังสือ มันจะได้วาดกรอบสีแดงล้อมรอบภาพจุดนั้นให้คุณเห็นบนหน้าจอทันที จะช่วยให้คุณตรวจสอบการเรียนรู้ของ AI ได้ง่ายขึ้นมากครับ4. ลำดับการทำงานของปุ่มล้างขยะ (Data Cleaning Execution Order)คำแนะนำ: ต้องวางลำดับให้ปุ่มนี้ทำงาน ก่อน การแปลงเป็นตัวเลขเสมอ ลำดับที่ถูกต้องคือ:ดึงข้อมูลจาก URL หรืออัปโหลดไฟล์ (PDF/Image)ได้ข้อความดิบมา \(\rightarrow \) *กดปุ่มล้างข้อมูลขยะ (ลบ HTML, ลบ @, #, , ปรับพิมพ์เล็ก)ส่งข้อความที่สะอาดแล้ว ไปตัดคำภาษาไทย (Tokenization)แปลงเป็นค่าตัวเลข 0.0000 แล้วบันทึกไฟล์ มีปุ่มกดเมื่อเทรนเสร็จแล้ว ให้ถอด UI ตอนเทรนออก ให้ใช้ UI ปกติ ซายมือมีปุ่ม สามขีด ช่ือข้อความแชท และมีข้อความตอบกับ และช่องอินพุต txt มีปุ่มกดส่ง txt มีปุ่มเลือกไฟล์
หมายเหตุใครมีไอเดียเพิ่มเติ่มได้ แล้วส่งไปให้ AI เขียนโค้ด ใครเก่งเขียนโค้ดเองก็เขียนตามนี้ได้เลย หรือให้ Ai เขียนจะแก้ไขตามใจชอบได้เลย ยกเว้นชื่อห้ามเปลี่ยน AI Thai chat
ผู้ออกแบบ LAM-Thai (Large Audio Model Thai)
ถ้าผู้ไดคิดจะเอาไปพัฒนาต่อ จงเคารพสิทธิ์ผู้ออกแบบให้ใช้ชื่อ เป็น AI Thai Chat
ลิงก์เชื่อมโยงกัน
https://m.pantip.com/topic/44113140