บทความ AI & Tech AI & Tech
ความรู้จากทีม Oneable — LLM, DevOps, Cloud และอื่นๆ Knowledge from the Oneable team — LLM, DevOps, Cloud and more
Deploy AI Model บน Kubernetes — Zero-Downtime พร้อม GPU Scheduling Deploy AI Model on Kubernetes — Zero-Downtime with GPU Scheduling
วิธีตั้งค่า Rolling Update, Resource Limits สำหรับ GPU และ Readiness Probe How to configure Rolling Updates, GPU Resource Limits and Readiness Probes
LLM ทำงานอย่างไร? ลึกถึง Transformer Architecture แบบเข้าใจง่าย How LLMs Work? Deep Dive into Transformer Architecture
เปิดฝากล่อง Large Language Model ตั้งแต่ Attention Mechanism, Positional Encoding ไปจนถึง RLHF Open up the Large Language Model from Attention Mechanism, Positional Encoding to RLHF
Deploy AI บน Kubernetes — Zero-Downtime พร้อม GPU Scheduling Deploy AI on Kubernetes — Zero-Downtime with GPU Scheduling
ตั้งค่า Rolling Update, Resource Limits สำหรับ GPU และ Readiness Probe เพื่อให้ AI API ไม่มี Downtime Configure Rolling Update, GPU Resource Limits and Readiness Probes for zero-downtime AI APIs
Go Clean Architecture — จัดโครงสร้างโปรเจกต์ให้ Scale ได้ Go Clean Architecture — Structure Your Project to Scale
แยก Domain, Repository, UseCase และ Handler ให้ชัดเจนด้วย Dependency Injection บน Go Separate Domain, Repository, UseCase and Handler clearly with Dependency Injection in Go
สร้าง AI Agent ด้วย Node.js + Claude API — Function Calling & Tool Use Build AI Agent with Node.js + Claude API — Function Calling & Tool Use
ตัวอย่าง Agent ที่ค้นหาข้อมูล เรียก API และตัดสินใจอัตโนมัติ พร้อม streaming response Example Agent that searches data, calls APIs and makes decisions automatically with streaming response
AWS Cost Optimization — ลดค่า Cloud 40% โดยไม่กระทบ Performance AWS Cost Optimization — Cut Cloud Costs 40% Without Impacting Performance
Spot Instances, Reserved Capacity, S3 Lifecycle Policy และ Right-sizing EC2 แบบ step-by-step Spot Instances, Reserved Capacity, S3 Lifecycle Policy and EC2 Right-sizing step by step
JWT Best Practices — หลีกเลี่ยงกับดักที่นักพัฒนามักพลาด JWT Best Practices — Avoid Traps Developers Often Fall Into
Algorithm confusion, token storage, refresh rotation และการ revoke token อย่างถูกต้อง Algorithm confusion, token storage, refresh rotation and proper token revocation
RAG คืออะไร? Retrieval Augmented Generation อธิบายฉบับปฏิบัติ What is RAG? Retrieval Augmented Generation Explained Practically
สร้างระบบ Q&A จากเอกสารของคุณด้วย Vector DB + LLM — ทั้ง chunking, embedding และ retrieval Build a Q&A system from your documents using Vector DB + LLM — chunking, embedding and retrieval