ภาพจาก https://appliedgo.net/perceptron/ Perceptron (เพอร์เซปทรอน):เป็นโครงข่ายประสาทเทียม (Neural Network) ที่มีโครงสร้างเรียบง่ายและเป็นพื้นฐาน ประกอบด้วยเหตุการณ์แค่ชั้นเดียว ประกอบด้วยโหนดแค่ตัวเดียวเท่านั้น และไม่มีการใช้ชั้นซ่อน (hidden layers) เป็นอันที่รู้จักกันดีในเส้นของประสิทธิภาพในการแก้ไขปัญหาความซับซ้อนน้อย อย่างเช่น การจำแนกแบบเส้นแบ่ง (linearly separable) แต่สำหรับปัญหาที่ซับซ้อนขึ้น โมเดลจะไม่สามารถแยกแยะได้และจะมีปัญหาการเรียนรู้ที่เกิดขึ้น (convergence problem) ดังนั้นในการแก้ไขปัญหาที่ซับซ้อนมากขึ้นจำเป็นต้องใช้โครงข่ายประสาทเทียมแบบ Multilayer Perceptron (MLP) Multilayer Perceptron (MLP) (เมอลติเลย์เปอร์เซปทรอน):เป็นโครงข่ายประสาทเทียมที่มีหลายชั้นซ่อน (hidden layers) ซึ่งช่วยให้โมเดลสามารถเรียนรู้และจับความซับซ้อนของข้อมูลได้มากขึ้น…
Month: August 2023
Hyperparameters Tuning ใน Deep learning
deep learning
Optimization algorithms ใน deep learning
#Gradient Descent #learning rate การปรับแต่ง (Optimization) เป็นขั้นตอนที่สำคัญในกระบวนการเรียนรู้ของโครงข่ายประสาทเทียม (Neural Networks) เพื่อให้โมเดลมีความแม่นยำและสามารถให้ผลลัพธ์ที่ดีที่สุดในการทำนายหรือตัดสินใจ เพื่อปรับค่าน้ำหนักของโครงข่ายประสาทเทียมให้เหมาะสมในการแก้ไขงานที่กำหนด มีอัลกอริทึมหลายรูปแบบที่สามารถใช้ในกระบวนการปรับแต่ง ดังนี้: อัลกอริทึมต่างๆ นี้มีลักษณะและการทำงานที่ต่างกัน และสามารถนำมาประยุกต์ใช้กับโครงข่ายประสาทเทียมต่างๆ ตามความเหมาะสมของงานและการแก้ไขปัญหาที่กำหนด เพิ่มเติม Loss Function (ฟังก์ชันสูญเสีย) เป็นฟังก์ชันที่ใช้ในการวัดความคลาดเคลื่อนระหว่างค่าผลลัพธ์ที่โมเดลทำนายและค่าเป้าหมาย (ground truth) ในกระบวนการเรียนรู้ของโมเดล ความคลาดเคลื่อนคือค่าความแตกต่างระหว่างผลลัพธ์ที่โมเดลทำนายกับผลลัพธ์ที่ถูกต้องจริงๆ โดยฟังก์ชันสูญเสียจะเป็นค่าที่ต้องการให้มีค่าน้อยที่สุด เพื่อให้โมเดลมีความแม่นยำในการทำนาย Gradient Descent (กระบวนการเคลื่อนที่แบบเกรเดียน): เป็นอัลกอริทึมที่ใช้ในการปรับค่าน้ำหนักของโครงข่ายประสาทเทียมเพื่อลดค่าความคลาดเคลื่อน…
Deep learning components องค์ประกอบของ Deep learning
deep learning
Deep Learning คืออะไร ทำไมใช้แค่ ML ไม่ได้
deep learning
LangChain คืออะไร
LangChain เป็นเฟรมเวิร์กโอเพนซอร์สสำหรับสร้างแอปพลิเคชันโดยใช้แบบจำลองภาษาขนาดใหญ่ (LLMs) ได้รับการออกแบบมาเพื่อให้ง่ายต่อการสร้างแอปพลิเคชันที่ซับซ้อนที่โต้ตอบกับ LLMs ในลักษณะที่เป็นธรรมชาติ LangChain มีคุณสมบัติหลายอย่างที่ทำให้ง่ายต่อการสร้างแอปพลิเคชันที่ใช้ LLM ได้แก่: LangChain ยังคงอยู่ระหว่างการพัฒนา แต่ได้ถูกใช้ในการสร้างแอปพลิเคชั่นที่น่าประทับใจจำนวนหนึ่งแล้ว ได้แก่: LangChain เป็นเครื่องมือที่ทรงพลังที่สามารถใช้ในการสร้างแอปพลิเคชั่นที่หลากหลาย หากคุณสนใจที่จะสร้างแอปพลิเคชั่นที่ใช้ LLMs LangChain เป็นจุดเริ่มต้นที่ดี ต่อไปนี้คือประโยชน์บางประการของการใช้ LangChain: วิธีการทำงานของ LangChain ภาพจาก https://ashukumar27.medium.com/the-agents-of-ai-1402548e9b8c user จะตั้งคำถามขึ้นหลังจากนั้นคำถามจะถูกส่งต่อไปยัง embedding model ) มีหน้าที่ในกระบวนการแปลงข้อมูลที่เป็นคำหรือเอนทิตีในภาษาธรรมชาติเป็นเวกเตอร์ของตัวเลขในพื้นที่เชิงเส้น…
Pre-trained language model คืออะไร
Pre-trained language model (โมเดลภาษาที่ถูกฝึกฝนล่วงหน้า) คือโมเดลภาษาที่ถูกฝึกฝนก่อนแล้วด้วยข้อมูลในปริมาณมหาศาล โดยใช้เทคโนโลยี Deep Learning เพื่อเรียนรู้ความหมายและโครงสร้างของภาษา โมเดลเหล่านี้เรียนรู้จากข้อมูลภาษามากมายจากเว็บไซต์ออนไลน์และเอกสารต่างๆ ซึ่งทำให้สามารถเข้าใจและทำนายข้อความภาษาธรรมชาติได้อย่างแม่นยำ ตัวอย่างที่น่าสนใจของโมเดลภาษาที่ถูกฝึกฝนล่วงหน้าคือ: การใช้งานของโมเดลภาษาที่ถูกฝึกฝนล่วงหน้าในภาษาไทย เช่น BERT และ GPT ได้รับความนิยมในการประมวลผลภาษาที่ซับซ้อนและท้าทาย เช่น การแปลภาษาแบบหลายภาษา การจำแนกประเภทของข้อความ การสร้างเนื้อหาสำหรับสื่อสร้างเนื้อหา การสร้างคำถามและคำตอบในรูปแบบที่สมจริง เป็นต้น โมเดลเหล่านี้ช่วยเพิ่มประสิทธิภาพในการประมวลผลภาษาธรรมชาติในชีวิตประจำวันและในธุรกิจ ทำให้การสื่อสารและการติดต่อกับผู้ใช้งานที่เป็นภาษาธรรมชาติเป็นไปได้อย่างราบรื่นและมีประสิทธิภาพมากขึ้น
Datafication คืออะไร
datafication