zero-shot learning
one-shot learning
few-shot learning
Category: Thai AI
Federated learning คืออะไร ใช้ในวงการไหนบ้าง
federated learning
Convolution Neural Network คืออะไร
Convolutional Neural Network (CNN) เป็นประเภทของโครงข่ายประสาทเทียม (Neural Network) ที่ใช้ในการประมวลผลข้อมูลที่มีลักษณะเป็นภาพและข้อมูลที่มีลักษณะเชิงพื้นที่ โครงสร้างของ CNN ถูกออกแบบให้เหมาะสำหรับการตรวจสอบและสกัดลักษณะที่เกี่ยวข้องในข้อมูลที่มีมิติสูงเช่นภาพ วิดีโอ และเสียง โครงสร้างของ CNN ประกอบด้วยเลเยอร์พื้นฐานดังนี้: โครงสร้างของ CNN ช่วยให้โมเดลมีความสามารถในการจำแนกหรือสกัดลักษณะในข้อมูลที่มีมิติสูง เช่น ภาพที่มีความเกี่ยวข้องกับการจำแนกออบเจ็กต์ และมีความเหมาะสำหรับงานที่ต้องการความรวดเร็วและความเท่าเทียมในการคำนวณ Kernal (เคอร์นัล) เป็นตัวกรองหรือมัสก์ที่ใช้ในการสกัดลักษณะ (feature extraction) จากข้อมูลนำเข้าในโครงข่ายประสาทเทียมแบบคอนโวลูชัน (Convolutional Neural Networks) โครงข่ายประสาทเทียมทำการคำนวณค่าผลลัพธ์โดยการนำตัวกรองหรือเคอร์นัลมาถ่วงค่าข้อมูลนำเข้าเพื่อให้ได้ลักษณะที่สำคัญและเกี่ยวข้องกับงานที่ต้องการทำ…
Feed forward neural network vs Backpropagation
Feedforward Neural Network (FFNN) หรือโครงข่ายประสาทเทียมที่เป็นตัวแบบในการส่งข้อมูลผ่านเลเยอร์ของโครงข่ายไปข้างหน้าเพื่อคำนวณผลลัพธ์ที่สุดท้าย โดยไม่มีการกลับไปสู่ชั้นก่อนหน้าเพื่อปรับแต่งพารามิเตอร์ (ไม่มีการใช้ backpropagation) นอกจากนี้ยังไม่มีการกำหนดวิธีการเรียนรู้แบบอัตโนมัติ ซึ่งต้องให้ค่าความเหมาะสมของพารามิเตอร์เอง โครงข่ายประสาทเทียมแบบ Feedforward มักถูกใช้ในงานที่เรียนรู้แบบควบคู่ (supervised learning) ที่ต้องการทำนายค่าของข้อมูลนำเข้า (input) ให้เป็นค่าของข้อมูลเป้าหมาย (output) โดยใช้ชุดข้อมูลที่มีคำตอบเป็นตัวอย่างในการฝึกฝน (training) โครงข่าย ซึ่งมีทั้งข้อมูลนำเข้าและข้อมูลเป้าหมายเพื่อปรับแต่งพารามิเตอร์ โครงข่ายประสาทเทียมแบบ Feedforward มีลักษณะการทำงานเป็นลักษณะเส้นตรง (sequential) โดยมีเลเยอร์ของโครงข่ายจากล่างสุดไปข้างบน โดยข้อมูลนำเข้าจะถูกส่งผ่านเลเยอร์ต่างๆ เพื่อคำนวณค่าในเลเยอร์สุดท้ายซึ่งเป็นผลลัพธ์ที่สุดท้ายของโมเดล นอกจากนี้ยังสามารถมีเลเยอร์ตั้งแต่ 1…
Regularization
Regularization (การปรับแต่ง) เป็นเทคนิคที่ใช้ในการลด(overfitting) ในโมเดลประสาทเทียม (Neural Network) และอื่นๆ ในกรณีที่โมเดลมีขนาดใหญ่หรือมีจำนวนพารามิเตอร์สูง โดยการปรับแต่งช่วยลดโอกาสในการเกิดความเกลียดเกรง และทำให้โมเดลทำนายข้อมูลที่ไม่เคยเห็นมาก่อนได้ดีขึ้น L1 Regularization หมายถึงการเพิ่มค่าของผลรวมค่าสัมบูรณ์ของพารามิเตอร์ในฟังก์ชันความสูญเสีย (loss function) ซึ่งทำให้โมเดลมีความเอาใจใส่ต่อความสำคัญของพารามิเตอร์แต่ละตัว ส่วนพารามิเตอร์ที่มีค่าเล็กๆ จะถูกลดลงในกระบวนการเรียนรู้ L2 Regularization หมายถึงการเพิ่มค่าของผลรวมของค่าเล็กๆ ของพารามิเตอร์ในฟังก์ชันความสูญเสีย การเพิ่มค่าเล็กๆ นี้จะทำให้พารามิเตอร์มีค่าที่เกินมากน้อยและทำให้โมเดลมีความเสถียรและไม่เกิดความเกลียดเกรง ความแตกต่างระหว่าง L1 และ L2 คือการเพิ่มค่าของค่าสัมบูรณ์ (magnitude) ของพารามิเตอร์ในฟังก์ชันความสูญเสีย ใน…
Autoencoder
ภาพจาก https://people.tuebingen.mpg.de/burger/neural_denoising/ Autoencoder (ออโตเอนโคเดอร์) เป็นอัลกอริทึมในด้านการเรียนรู้ของเครื่อง ในพื้นที่ของการเรียนรู้แบบไม่มีควบคุม (Unsupervised Learning) ที่ใช้ในงานการลดมิติของข้อมูล (Dimensionality Reduction) และสร้างโมเดลใหม่ที่สามารถเข้าใจและสร้างความหมายจากข้อมูลแบบซับซ้อนได้ โดยมักนำมาใช้ในการเรียนรู้ลึก (Deep Learning) และงานที่เกี่ยวข้องกับการค้นหาลักษณะ (Feature Learning) หรือเรียนรู้การแทนภาพข้อมูล (Representation Learning) ที่เป็นเวกเตอร์แทนข้อมูลเดิมให้มีมิติต่ำลง ซึ่งช่วยลดขนาดของข้อมูลและเพิ่มประสิทธิภาพในการจัดการข้อมูลต่อไป โครงสร้างของ Autoencoder ประกอบด้วยสองส่วนหลักคือ “Encoder” และ “Decoder” ซึ่งทำหน้าที่คือ: หลังจากเรียนรู้จากข้อมูลแบบซับซ้อน โมเดล…
ACTIVATION FUNCTION และประเภทของ Activation function
deep learning
Neural network และ Artificial Neural Network
deep learning
Perceptron และ multilayer perceptron
ภาพจาก https://appliedgo.net/perceptron/ Perceptron (เพอร์เซปทรอน):เป็นโครงข่ายประสาทเทียม (Neural Network) ที่มีโครงสร้างเรียบง่ายและเป็นพื้นฐาน ประกอบด้วยเหตุการณ์แค่ชั้นเดียว ประกอบด้วยโหนดแค่ตัวเดียวเท่านั้น และไม่มีการใช้ชั้นซ่อน (hidden layers) เป็นอันที่รู้จักกันดีในเส้นของประสิทธิภาพในการแก้ไขปัญหาความซับซ้อนน้อย อย่างเช่น การจำแนกแบบเส้นแบ่ง (linearly separable) แต่สำหรับปัญหาที่ซับซ้อนขึ้น โมเดลจะไม่สามารถแยกแยะได้และจะมีปัญหาการเรียนรู้ที่เกิดขึ้น (convergence problem) ดังนั้นในการแก้ไขปัญหาที่ซับซ้อนมากขึ้นจำเป็นต้องใช้โครงข่ายประสาทเทียมแบบ Multilayer Perceptron (MLP) Multilayer Perceptron (MLP) (เมอลติเลย์เปอร์เซปทรอน):เป็นโครงข่ายประสาทเทียมที่มีหลายชั้นซ่อน (hidden layers) ซึ่งช่วยให้โมเดลสามารถเรียนรู้และจับความซับซ้อนของข้อมูลได้มากขึ้น…
Hyperparameters Tuning ใน Deep learning
deep learning