Category: Thai AI
Evaluation method สำหรับ classification problem
Evaluation Method and Confusion Matrix (วิธีการประเมินและเมตริกซ์ความสับสน) เป็นเครื่องมือที่ใช้ในการวัดและประเมินประสิทธิภาพของโมเดลทำนายในงานการเรียนรู้และการจำแนกข้อมูล โดยเฉพาะในกรณีที่มีปัญหาการจำแนก (Classification Problems) ซึ่งต้องการทำนายประเภทหรือคลาสของข้อมูล มีวิธีการต่าง ๆ ในการประเมินความแม่นยำและประสิทธิภาพของโมเดลดังนี้: Confusion Matrix (เมตริกซ์ความสับสน) เป็นตารางที่ใช้ในการแสดงผลลัพธ์ของการทำนายโดยแบ่งข้อมูลที่ทำนายได้เป็น 4 ส่วน ดังนี้: รูปภ่าพมาจาก https://towardsdatascience.com/understanding-confusion-matrix-a9ad42dcfd62 Confusion Matrix ใช้ในการวัดประสิทธิภาพของโมเดลทำนายและการจำแนกข้อมูลในแต่ละคลาส โดยเราสามารถคำนวณหาค่าความแม่นยำ (Accuracy), ความแม่นยำในการพยากรณ์ค่าบวก (Precision), ความแม่นยำในการคืบหน้าค่าบวก (Recall),…
Training data and Testing data คืออะไร และ evaluation method (วิธีการประเมินคุณภาพโมเดล)สำหรับ regression และ classification model
Training Data (ชุดข้อมูลฝึก) คือชุดข้อมูลที่ใช้ในขั้นตอนการเรียนรู้ (Training) โมเดลในการสร้างโมเดลทำนาย (Predictive Models) หรือโมเดลจำแนก (Classification Models) โดยให้โมเดลทำนายผลลัพธ์ที่ถูกต้องมากที่สุดจากข้อมูลในชุดข้อมูลนี้ เช่น ข้อมูลที่มีคำตอบหรือป้ายกำกับที่ถูกต้อง การเรียนรู้จากชุดข้อมูลฝึกนี้จะช่วยปรับปรุงพารามิเตอร์ (Parameters) ในโมเดลให้กับการทำนายให้เหมาะสมกับข้อมูลต้นฉบับ Testing Data (ชุดข้อมูลทดสอบ) คือชุดข้อมูลที่ใช้ในขั้นตอนการทดสอบ (Testing) โมเดลทำนายหรือโมเดลจำแนกที่ได้รับการเรียนรู้จากชุดข้อมูลฝึก โดยให้โมเดลทำนายผลลัพธ์จากข้อมูลในชุดข้อมูลนี้ เพื่อวัดประสิทธิภาพและความแม่นยำของโมเดลในการทำนายข้อมูลที่ไม่เคยเห็นมาก่อน (Unseen Data) หรือข้อมูลที่ไม่ได้ใช้ในขั้นตอนการเรียนรู้ การทดสอบนี้ช่วยให้เราประเมินว่าโมเดลทำนายในระหว่างการทำนายและจำแนกความถูกต้องได้ดีเพียงใด Evaluation Method (วิธีการประเมิน)…
ENSEMBLE LEARNING คืออะไร
Ensemble Learning (การเรียนรู้แบบกลุ่ม) เป็นเทคนิคหนึ่งในการสร้างและพัฒนาโมเดลทำนาย (Predictive Models) และโมเดลจำแนก (Classification Models) โดยการรวมกันของหลายโมเดลย่อย (Sub-Models) หรือตัวจำแนกหรือตัวทำนายหลาย ๆ ตัวเข้าด้วยกันเพื่อเพิ่มความแม่นยำและประสิทธิภาพในการทำนายหรือจำแนกข้อมูล การใช้งานแบบกลุ่มนี้มีเป้าหมายเพื่อลด Bias และ Variance ในการทำนาย และลดโอกาสในการเกิด Overfitting หรือ Underfitting ของโมเดล ซึ่งช่วยให้สามารถประยุกต์ใช้กับชุดข้อมูลที่มีความซับซ้อนหรือขนาดใหญ่ได้ดีขึ้น นอกจากนี้ยังช่วยให้สามารถค้นหาและเรียนรู้ความสัมพันธ์ที่ซับซ้อนของข้อมูลได้มากขึ้น ด้วยเหตุนี้ การใช้งาน Ensemble Learning เป็นที่นิยมในการแก้ไขปัญหาที่มีความซับซ้อนสูง หรือความลำบากในการสร้างโมเดลทำนายที่แม่นยำและน่าเชื่อถือ…
BIAS AND VARIANCE TRADEOFF คืออะไร
Bias-Variance Tradeoff (การแลกเปลี่ยนความสมดุลระหว่าง Bias และ Variance) เป็นหลักการที่เกี่ยวข้องกับการสร้างและประเมินความสามารถของโมเดลในการทำนายและจำแนกข้อมูลในการเรียนรู้แบบต่าง ๆ ในเชิงสถิติและการเรียนรู้ของเครื่อง (Machine Learning) Bias คือความคาดหวังหรือความเป็นไปได้ที่โมเดลจะทำนายหรือจำแนกค่าตัวแปรตามข้อมูลต้นฉบับ ความคาดหวังที่มากของ Bias หมายถึงโมเดลมีความเรียนรู้ที่ไม่เพียงพอ นั่นคือ โมเดลไม่สามารถเรียนรู้ความสัมพันธ์ในข้อมูลเข้ากันได้ดีพอ และมีความเบียดบังในการทำนายหรือจำแนกข้อมูลตามข้อมูลต้นฉบับ Variance คือความคาดหวังของความคลาดเคลื่อนของโมเดลในการทำนายหรือจำแนกค่าตัวแปรตามข้อมูลที่ไม่เห็นมาก่อน ความคาดหวังที่มากของ Variance หมายถึงโมเดลมีความยืดหยุ่นในการเรียนรู้มากเกินไป นั่นคือ โมเดลมีความแม่นยำในการทำนายหรือจำแนกข้อมูลตามข้อมูลต้นฉบับ แต่มีความเบียดบังในการทำนายหรือจำแนกข้อมูลที่ไม่เห็นมาก่อน การแลกเปลี่ยนความสมดุลระหว่าง Bias และ Variance คือหากเราปรับความซับซ้อนของโมเดลให้มากขึ้น…
OVERFITTING และ UNDERFITTING คืออะไร ใน Machine Learning
การเรียนรู้เกินกว่าที่ควร (Overfitting) คือปัญหาที่เกิดขึ้นเมื่อโมเดลที่ถูกสร้างขึ้นมีความซับซ้อนมากเกินไป ซึ่งทำให้โมเดลมีความสามารถในการเรียนรู้ข้อมูลในชุดข้อมูลสำหรับการฝึกอย่างละเอียด แต่ไม่สามารถทำนายข้อมูลที่ไม่เห็นมาก่อนได้ โมเดลอาจเก็บข้อมูลในชุดข้อมูลฝึกทุกจุดละเอียด ทำให้ไม่สามารถแยกแยะหรือทำนายข้อมูลในชุดข้อมูลทดสอบหรือชุดข้อมูลใหม่ได้ดีพอ เมื่อโมเดลทำงานในสภาวะ Overfitting จะมีลักษณะดังนี้: เพื่อแก้ไขปัญหาการเรียนรู้เกินกว่าที่ควร (Overfitting) สามารถทำได้โดย: การเรียนรู้ไม่เพียงพอ (Underfitting) คือปัญหาที่เกิดขึ้นเมื่อโมเดลที่ถูกสร้างขึ้นไม่สามารถเรียนรู้ข้อมูลในชุดข้อมูลที่มีอยู่ได้ดีพอ ซึ่งทำให้โมเดลไม่สามารถทำนายหรือจำแนกข้อมูลที่ไม่เห็นมาก่อนได้ โมเดลอาจมีความซับซ้อนไม่เพียงพอหรือไม่มีความสามารถในการกลับกลับของข้อมูลที่มีความซับซ้อน เมื่อโมเดลทำงานในสภาวะ Underfitting จะมีลักษณะดังนี้: เพื่อแก้ไขปัญหาการเรียนรู้ไม่เพียงพอ สามารถทำได้โดย: การแก้ไขปัญหา Underfitting นี้จำเป็นต้องใช้เทคนิคและการปรับแต่งโมเดลให้เหมาะสมกับข้อมูลในการเรียนรู้เพื่อให้สามารถทำนายผลลัพธ์ในชุดข้อมูลที่ไม่เห็นมาก่อนได้แม่นยำและน่าเชื่อถือยิ่งขึ้น
Logistic regression และ Multinomial logistics regression
Logistic regression และ Multinomial logistics regression
Supervised learning คืออะไร และประเภทของ Supervised learning
(Supervised Learning Algorithms) หมายถึง วิธีการเรียนรู้ที่เป็นกระบวนการที่คอมพิวเตอร์หรือระบบคอมพิวเตอร์ทำการเรียนรู้จากข้อมูลที่มีการควบคุม (คำตอบหรือป้ายชื่อ) ที่ถูกต้องอยู่แล้ว สามารถนำไปใช้ทำนายหรือจำแนกข้อมูลในอนาคตได้ การเรียนรู้แบบมีการควบคุมนี้ เป็นกระบวนการที่คล้ายกับการสอนของครูโดยให้ตัวอย่างของการตอบปัญหามาแล้วคอมพิวเตอร์จะเรียนรู้จากตัวอย่างนั้นเพื่อใช้ในการจำแนกหรือทำนายข้อมูลใหม่ ในกระบวนการเรียนรู้แบบมีการควบคุมนี้ ข้อมูลที่ใช้ในการเรียนรู้จะประกอบด้วยคุณลักษณะ (features) ของข้อมูลที่ต้องการจำแนกหรือทำนายและคำตอบ (labels) หรือป้ายชื่อที่บ่งบอกถึงคำตอบที่ถูกต้องสำหรับข้อมูลนั้น ตัวอย่างของการเรียนรู้แบบมีการควบคุมคือการจำแนกภาพที่มีคำอธิบายเป็น “แมว” หรือ “หมา” และระบบจะเรียนรู้จากคุณลักษณะของภาพเหล่านั้นเพื่อจำแนกว่าภาพใหม่ๆ ที่ไม่เคยเห็นมาก่อนเป็นภาพของแมวหรือหมา Supervised Learning มีความสำคัญในการแก้ไขปัญหาที่เรามีข้อมูลตัวอย่างที่มีคำตอบหรือป้ายชื่อที่ถูกต้อง ตัวอย่างของงานที่ใช้ Supervised Learning ได้แก่ การจำแนกอีเมลเป็นอีเมลที่เป็นสแปมหรือไม่สแปม, การทำนายราคาบ้านจากข้อมูลสถานะของบ้าน เป็นต้น…
ความแตกต่างระหว่าง AI และ Machine Learning
ความแตกต่างของ AI และ Machine Learning
Machine learning คืออะไร มีกี่ประเภท
การเรียนรู้ของเครื่อง (Machine Learning) เป็นกระบวนการที่คอมพิวเตอร์สามารถเรียนรู้และปรับปรุงการทำงานของตนได้โดยไม่ต้องโปรแกรมแบบชัดเจน ประเภทของ Machine Learning ประกอบด้วย: