์๋
ํ์ธ์๐
์๋ฆฌ๋ฅผ ํ๊ณ ๋ค์ด ์ค์ ์ ์ ์ฉํ๋ 'AI ํ
ํฌ ์ธ์ฌ' ๊น๋์ค ์
๋๋ค!
๋จ์ํ ๋ง๋ค์ด์ง ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ์ฌ์ฉํ๋ ๊ฒ์ ๋์ด, "๋ชจ๋ธ ๋ด๋ถ์ ํต์ฌ ๋ก์ง๊ณผ ์ํ์ ์๋ฆฌ๋ฅผ ์ดํดํด์ผ๋ง ์ค๋ฌด์ ์ฃ์ง ์ผ์ด์ค(Edge Case)๋ฅผ ํด๊ฒฐํ ์ ์๋ค" ๊ณ ๋ฏฟ์ต๋๋ค. ๋ ผ๋ฌธ์ ์ง์ ๊ตฌํํ๋ฉฐ ๋ค์ง '๊ธฐ์ด ์ฒด๋ ฅ' ์์, ๋ฐ๋ฐ๋ฅ(From Scratch) โ ์ ์ดํ์ต/ํ์ธํ๋ โ SOTA ๋ชจ๋ธ ์ต์ ํ ๋ฐ ์๋น(Triton/TensorRT) ๊น์ง ์ด์ด์ง๋ ์๋ํฌ์๋ AI ํ์ดํ๋ผ์ธ์ ์ค๊ณํ๊ณ ์์ต๋๋ค.
ํต์ฌ 3๋ ํค์๋ โ From Scratch (์๋ฆฌ ๊ฒ์ฆ) ยท Production & Edge (Triton ยท RAPIDS ยท Jetson) ยท Multi-Modal (Vision ยท Language ยท Voice ยท Sensor)
- Foundations (๋
ผ๋ฌธ ์ง์ ๊ตฌํ):
PyTorch,NumPyonly โ Transformer, ResNet, GPT, VAE, GAN, Diffusion, CLIP, Mini-LLaVA (VLM) - LLM & NLP:
LangChain,LangGraph,Gemini 2.0 Flash,OpenAI API,Qwen2.5,EXAONE-3.5,Hugging Face Transformers,KoGPT2,KLUE-BERT,Sentence-Transformers - LLM Fine-Tuning & Optimization:
Unsloth,QLoRA (4-bit NF4),GGUF,PEFT,Pydantic-Structured Output - Computer Vision:
PyTorch,Torchvision,YOLOv5,YOLOv8,U-Net,FCN,SMP (segmentation_models_pytorch),ResNet,GANs,OpenCV - RAG & Vector DB:
ChromaDB,FAISS,RecursiveCharacterTextSplitter,LCEL,Multi-Collection Routing - Reinforcement Learning:
Q-Learning,DQN,Experience Replay,Frame Stacking,Gymnasium - Data Engineering & Acceleration:
NVIDIA RAPIDS (cuDF / cuGraph),Dask,CUDA (Numba),Parquet,NetworkX - MLOps & Deployment:
NVIDIA Triton Inference Server,TensorRT,ONNX,llama.cpp,Dynamic Batching,Hugging Face Spaces,Gradio,Streamlit - Edge AI & Full-Stack:
NVIDIA Jetson,ROS 2,FastAPI,Flutter
"๋ผ์ด๋ธ๋ฌ๋ฆฌ ํ ์ค๋ก ๋๋๋ ์ฝ๋๋ ๋๊ตฌ๋ ์์ฑํ ์ ์๋ค." โ ๊ทธ๋์ ์ ๋ ๋ชจ๋ธ์ ํต์ฌ ๋ฉ์ปค๋์ฆ์ PyTorch / NumPy ๋ง์ผ๋ก ์ง์ ๊ตฌํํ๋ฉฐ "์ ์ด ๊ตฌ์กฐ์ธ๊ฐ"๋ฅผ ์ค๋ช ํ ์ ์๋ ๊น์ด๋ฅผ ์์์ต๋๋ค.
- โญ
vlm-from-scratch-v4โ v3 ๊ฐ ์ ๋ ์ ์ฆํ "vision encoder ํฌ๊ธฐ โ VLM ๋ฅ๋ ฅ, LLM ์ด ์ง์ง ๋ณ๋ชฉ" ๊ฒฐ๋ก ์ ์ ๋ฉด ๋ํํ 4์ธ๋ ๋ฐ๋ณต. v3 ๊ฐ ์ถ๋ก wrapper 5์ข ์ผ๋ก ์ฐํ ํ๋ 0.5B LLM ํ๊ณ๋ฅผ, v4 ๋ ์ธ์ด ๋ชจ๋ธ ์์ฒด๋ฅผ Qwen2.5-1.5B-Instruct ๋ก ๊ต์ฒด (0.5B โ 1.5B, 3๋ฐฐ) ํด ์ ๊ณต๋ฒ์ผ๋ก ํด๊ฒฐ. CLIP-ViT-B/32 (frozen) + ํ์ตํ 2-layer MLP projector (768โ1536, GELU) + 4-bit NF4 QLoRA ๊ตฌ์กฐ๋ฅผ double quantization ์ผ๋ก ์์ถ(fp32 6 GB โ 0.9 GB)ํด ๋จ์ผ 8 GB consumer GPU ์์ 2-stage ํ์ต (projector alignment loss 5.0โ1.98 / instruction tuning loss 3.65โ1.01). Qwen2.5 ๋ด์ฅ<|image_pad|>ํ ํฐ์ ์ฌ์ฌ์ฉํด ์ ๊ท ํ ํฐ ์์ด v3 ์ 1 GB adapter bloat ๋ฅผ ์์ฒ ์ฐจ๋จ, custom_mergeํจ์๋ก ์๋ฒ ๋ฉ splice ์ง์ ๊ตฌํ. VQAv2 36.7% โ 56.8%, POPE 50.0% โ 71.8% (yes-F1 0.735 ยท prediction bias 0.568 ยท refusal rate 0.000), first-token entropy ๊ธฐ๋ฐ OOD ํ์ง ROC AUC 0.971 ์ OOD abstention layer ๋ก ํ๊ฐ ๊ฒฝ๊ณ . ๊ฒ์ฆ ๊ฒ์ดํธ๋ฅผ ๋ฐฐํฌ ์ด์ ์ผ๋ก ์ด๋, Stage 2 ๋ VQAv2ยทLocalizedNarrativesยทA-OKVQAยทKoLLaVA(ํ๊ตญ์ด) 46K ํผํฉ ๋ฐ์ดํฐ. vlm-from-scratch-v3โ v2 ์ 3๊ฐ์ง ํ๊ณ (ํ๊ตญ์ด catastrophic forgetting ยท OOD ํ๊ฐ ยท 1GB adapter) ๋ฅผ ๋ชจ๋ ํด๊ฒฐํ ์ฐจ์ธ๋ ๋ฐ๋ณต. ์ถ๋ก wrapper 5์ข (CLIP yes/no ๊ฒ์ดํ ยท CLIP ์์ ๋ถ๋ฅ ยท ์ถ๋ ฅ ํ์ฒ๋ฆฌ ยท m2m100 ํโ์ ๋ฒ์ญ ยท OOD ๊ฐ์ง layer) ์ผ๋ก 0.5B LLM ํ๊ณ๋ฅผ ์ฐํ. POPE 50% โ 53.33% (untuned) / 70% (tuned), LoRA adapter 1045 MB โ 8.28 MB (โ99.21%, greedy ์ถ๋ ฅ bit-๋จ์ ๋์ผ). ViT-L/14 ablation ์คํจ์์ "vision encoder ํฌ๊ธฐ โ VLM ๋ฅ๋ ฅ โ LLM ์ด ์ง์ง ๋ณ๋ชฉ" ์ ๋ ์ ์ฆ. HF Spaces Live Demo + gradio_client API + Playwright Chromium ์๋ํ๋ก 3์ค ์ธ๋ถ ๊ฒ์ฆ.vlm-from-scratch (Mini-LLaVA v1โv2)โ v3 ์ ์ถ๋ฐ์ ์ด ๋ baseline. CLIP-from-scratch + GPT-from-scratch ์ ๋น๋ฉ ๋ธ๋ก์ ์ค๋ฌด ์ค์ผ์ผ๋ก ์กฐ๋ฆฝํ ๋ฉํฐ๋ชจ๋ฌ LLM. HuggingFaceLlavaForConditionalGeneration๋ฏธ์ฌ์ฉ,<image>ํ ํฐ splice / projector / LoRA adapter ํตํฉ ์ง์ ๊ตฌํ. v1 (Stage 1 alignment) ํ๊ณ ์ ๋ ๋ถ์ โ v2 (Stage 2 LoRA + ๊ท ํ instruction ๋ฐ์ดํฐ) ๋ก ๊ฐ์ ํ๋ ๋ ์ฐจ๋ก ๋ฐ๋ณต ์ฌ์ดํด ์ ์ฒด ๊ธฐ๋ก. ์๋ฌธ ๊ฐ์์ง VQA 5๋ฌธํญ 4/5 ์ ํ, ํ๊ตญ์ด์์ catastrophic forgetting ์ ๋ ์ ์ฆ, ํผ์นด์ธ(OOD)์์ ์ฒด๊ณ์ ์ค๋ฅ ํจํด ๋ถ์ ๊น์ง ๋ชจ๋ธ ํ๊ณ์ ์์งํ ํด๋ถ.- โญ
transformer-from-scratchโ ใAttention Is All You Needใ ๋ ผ๋ฌธ ์ฌํ.nn.Transformer/ HuggingFace ๋ฏธ์ฌ์ฉ, Scaled Dot-Product Attention ยท Multi-Head ยท Sinusoidal Positional Encoding ยท Encoder-Decoder ๋ฅผ ํ ์ ์ฐ์ฐ๋ง์ผ๋ก ๊ตฌํ. ํ ์ด ํ์คํฌ์์ Val Acc 98.4%, Attention Heatmap์ anti-diagonal ํจํด์ผ๋ก ํ์ต ์๋ฆฌ ๊ฒ์ฆ. gpt-from-scratchโ nanoGPT ์๊ฐ์ Decoder-only Transformer (10.79M params). Q/K/V ๋ถํ ๊น์ง ์์์ฑ, ์์ฒด Char-level Tokenizer (vocab 65), Tiny Shakespeare ํ์ต ํ Greedy / Temperature / Top-k ์ํ๋ง ๋น๊ต.resnet-from-scratchโ Skip Connection์ด Degradation Problem์ ์ ๋ง ํด๊ฒฐํ๋๊ฐ? ๋ฅผ ๊ฒ์ฆ. ๋์ผ ๊น์ดยทํ๋ผ๋ฏธํฐ์ Plain-20 vs ResNet-20 ๋น๊ต ์คํ์์out + shortcut(x)๋จ ํ ์ค์ ํจ๊ณผ๋ฅผ +2.19%p (89.16% vs 86.97%) ๋ก ์ ๋ํ.diffusion-models-from-scratchโ U-Net + Sinusoidal Time Embedding + Classifier-Free Guidance ๋ฅผ ํ ํ์ผ์. Forward/Reverse ํ์ฐ ๊ณผ์ ๊ณผ Bernoulli Context Mask๊น์ง ์ง์ ๊ตฌํ.vae-from-scratchโ Reparameterization Trick ยท ELBO (Reconstruction + ฮฒยทKL) ์ง์ ๊ตฌํ. 16์ฐจ์ Latent Space์์ Latent Traversal๊ณผ Interpolation์ผ๋ก ์ฐจ์๋ณ ์๋ฏธ ๋ถ์.gan-from-scratchโ DCGAN (ConvTranspose Generator + Conv Discriminator) ์ผ๋ก Minimax ๊ฒ์ ์ง์ ์์ฑ. Mode Collapse ๊ฒ์ฆ, D Accuracy 0.5 ๊ท ํ ๋ชจ๋ํฐ๋ง, VAE vs GAN (Blurry vs Sharp) ๋์ผ ์กฐ๊ฑด ๋น๊ต.clip-from-scratchโ ์ด์ From-Scratch ๋ถํ(ResNet-20 + Transformer)์ ์ง์ ์กฐ๋ฆฝํ Multi-Modal ์์คํ . Symmetric InfoNCE Loss + Learnable Temperature ฯ๋ก ํ์ต, ํ์ต ์์ 64.4% vs Zero-shot 64.6% โ ์๋ฒ ๋ฉ ๊ณต๊ฐ ์ ๋ ฌ(Alignment) ์ฑ๊ณต.object-detection-fundamentalsโ IoU ยท NMS ยท ๋ฉํฐํ์คํฌ(์ขํ ํ๊ท + ๋ถ๋ฅ) Loss ๋ฐธ๋ฐ์ฑ ์ NumPy๋ก ์ง์ ๊ตฌํ. ResNet18 Backbone ์์ ํฝ์ ์ขํ๊ณ๋ถํฐ ์์ผ๋ก.image-segmentation-from-scratchโ 3๋จ๊ณ ์ฌํ ํ์ต (FCN8s ๋ ผ๋ฌธ ์ฌํ โ U-Net ์ง์ ์ค๊ณ โ SMP ์ค๋ฌด). ๋จ์ ์ฝ๋ ์ฌํ์ด ์๋ "์ ์ด ๊ตฌ์กฐ์ธ๊ฐ"๋ฅผ ์ค๋ช ํ ์ ์๋ ๊น์ด.
langchain-rag-enterprise-chatbotโ 5์ข ์ฌ๋ด ๋ฌธ์(TXT/JSON/JSONL/CSV/PDF) ๋ฅผ ๋ฉํฐ ์ปฌ๋ ์ ChromaDB๋ก ๋ถ๋ฆฌ ์ ์ฅํ์ฌ ์์ฐ์ด ๋ผ์ฐํ ๊ธฐ๋ฐ RAG ์ฑ๋ด ๊ตฌ์ถ. JSON์ ํต์งธ๋ก ๋ณด์กด, ํ ์คํธ๋ ์ฒญํฌ ๋ถํ ๋ฑ ํ์๋ณ ์ ๋ต ์ฐจ๋ณํ.- โญ
langchain-production-chatbotโ LangGraph + Pydantic Structured Output ์ผ๋ก ๋ถ๋ฅยท๋ฉ๋ชจ๋ฆฌยท๋ผ์ฐํ ์ ํ ํธ์ถ์. InMemorySaver thread ๊ฒฉ๋ฆฌ + SummarizationMiddleware (4000 ํ ํฐ ์๊ณ์น) ๋ก ํ ํฐ ํญ์ฃผ ๋ฐฉ์ง. langchain-agent-tool-integrationโ LLM์ด ์ธ๋ถ ์์คํ (์๊ฐ ์กฐํ / ์น ์คํฌ๋ํ / SQL)์ ์ง์ ์ ๊ทผํ๋ 3์ข Tool ํตํฉ Agent. ์์คํ ํ๋กฌํํธ๋ก ์ฝ๊ธฐ ์ ์ฉ SQL ๊ฐ์ ๋ฑ ์์ ์ค๊ณ.- โญ
rag-chatbotโ LangChain + Chroma + Gemini 2.0 Flash ๋ก ๋ํ ๋ฉ๋ชจ๋ฆฌ ์ ์ง RAG ์ฑ๋ด ๊ตฌ์ถ, Gradio UI๋ก Hugging Face Spaces ๋ฐฐํฌ๊น์ง ์๋ํฌ์๋ ์์ฑ. nlp-portfolioโ ์ํ์ ๊ธฐ์ด(NumPy Self-Attention) โ ๋ถ๋ฅ(BERT/Logistic Regression) โ ์๋ฏธ ๊ฒ์(Multilingual-MiniLM) 3๋จ๊ณ ์ผ๊ด ํ์ดํ๋ผ์ธ. Error Analysis ์ค์ฌ์ Data-Centric ์ ๊ทผ.
unsloth-qlora-finetuningโ Llama-3 8B๋ฅผ T4 16GB ํ ์ฅ์ผ๋ก ํ์ธํ๋. 4-bit NF4 ์์ํ + LoRA๋ก ์ ์ฒด ํ๋ผ๋ฏธํฐ์ 0.08% ๋ฏธ๋ง๋ง ํ์ต, VRAM 60% ์ ๊ฐ / ํ๋ จ ์๋ 2.6๋ฐฐ ๊ฐ์.- โญ
kogpt2-korean-finetuningโ KoGPT2๋ฅผ NSMC ์ํ ๋ฆฌ๋ทฐ ๋๋ฉ์ธ์ผ๋ก ํ์ธํ๋. PreTrainedTokenizerFast ์ธ๋ฑ์ค ๋ฐ๋ฆผ ๋ฌธ์ ๋ฅผ ๊ทผ๋ณธ ๋๋ฒ๊น , Top-P ยท Temperature ยท Repetition Penalty ๋์ฝ๋ฉ ์ ๋ต ๋น๊ต. nlp-bert-finetuningโ Self-Attention โ BERT โ ์ ์ด ํ์ต([CLS] Token Pooling)๊น์ง ๋จ๊ณ๋ณ ํ์ต.
nlp-triton-deploymentโ BERT๋ฅผ PyTorch โ ONNX โ NVIDIA Triton Inference Server ๋ก ๋ฐฐํฌ.config.pbtxt์dims:[-1]๋์ ์ถ ์ง์ + Dynamic Batching + ๋์ ํจ๋ฉ ์ผ๋ก ์ง์ฐ ์๊ฐ 45ms โ 12.5ms (โผ72%) / ์ฒ๋ฆฌ๋ 22 โ 145 TPS (โฒ6.6๋ฐฐ) ๋ฌ์ฑ.
nlp-foundationsโ Attention ๋ฉ์ปค๋์ฆ์ NumPy๋ก ์ง์ ๊ตฌํ + KLUE-BERT ํ์ธํ๋ (NSMC ์ ํ๋ 50% โ 89%) + Masked LM์ ์ฌํ์ ํธํฅ์ฑ ๋ถ์.nlp-preprocessing-foundationโ ํ ์คํธ ์ ์ ยท์ ๊ทํยทํ ํฐํยทTF-IDFยทRNN/LSTM ๊น์ง OOP ๋ชจ๋ํ.nlp-text-classificationโ ์ํ ๋ฆฌ๋ทฐ(์ด์ง) + ๊ตญ๋ฏผ์ฒญ์(17๊ฐ ๋ค์ค ๋ถ๋ฅ) ํ์ดํ๋ผ์ธ. ๋ฐ์ดํฐ ๋ถ๊ท ํยท๋ฐ์ด๋ฒ ํ๊ณ ๋ถ์.nlp-semantic-searchโ Sentence-Transformers + Cosine Similarity ์๋ฏธ ๊ฒ์ ์์คํ .
yolov5-pothole-detectorโobject-detection-fundamentals์ ์๋ฆฌ ์์ YOLOv5s ๋จ์ผ ํด๋์ค(nc=1) ์ปค์คํ ํ์ต ์ผ๋ก ์ค์ ๋๋ก ์์์์ ํฌํธํ ํ์ง. mAP@0.5 0.85+ ์ ์ค๋ฌด ์๋น์ค ์์ค ํ์ดํ๋ผ์ธ ์์ฑ.multimodal-ai-sensor-fusionโ RGB + LiDAR ์ผ์ ๊ฒฐํฉ. Early / Late / Intermediate 3๊ฐ์ง ์ตํฉ ์ํคํ ์ฒ ๋น๊ต + CLIP ์คํ์ผ NT-Xent ๋์กฐํ์ต. ๋จ์ผ ๋ชจ๋ธ 92.7% โ ์ตํฉ ๋ชจ๋ธ 100% ์ธ์๋ฅ , ์ ์ฌ๋ ํ๋ ฌ 95% ๊ฐ์๋ก ์ ๋ ฌ(Alignment) ์ ์ฆ.pytorch-image-classificationโ ํ ์ ์กฐ์ โ MLP/CNN/VGG ์ง์ ์ค๊ณ โ ResNet ์ ์ดํ์ต๊น์ง ์ด๋ฏธ์ง ๋ถ๋ฅ ์ ๊ณผ์ . OOM ๋ฌธ์ ํด๊ฒฐ๋ก ํ๋์จ์ด ํ์ดํ๋ผ์ธ ์์ง๋์ด๋ง ์ญ๋ ํ๋ณด.- โญ
resnet-transfer-learning-cifar10โ ResNet50 vs ResNet101 ํจ์จ์ฑ ๋น๊ต, Stage A/B ์ ์ดํ์ต ์ ๋ต ๋ถ์, ImageNet Pretrained Weights์ Skip Connection ํจ๊ณผ ์คํ์ ๊ฒ์ฆ.
- โญ
car-racing-dqnโCarRacing-v2์์ 96x96 ํฝ์ โ CNN-DQN ์ง์ ํ์ต. Frame Stacking (4 frames) ยท Experience Replay ยท Target Network ๋ก ํ์ต ์์ ํ, Hugging Face ๋ฐฐํฌ ์๋ฃ. rl-optimization-benchmarkโ ๋์ผํ Q-Learning ์๊ณ ๋ฆฌ์ฆ์ผ๋ก Taxi โ CliffWalking โ Blackjack ๋์ฅ๊นจ๊ธฐ. 500๊ฐ ์ํ๋ถํฐ ํํ ์ํ๊น์ง ์๋ฃ๊ตฌ์กฐ ํ์ฅ์ผ๋ก ๋ฒ์ฉ ์ค๊ณ ๋ฅ๋ ฅ ์ ์ฆ.rl-q-learningโ FrozenLake์์ ํฌ์ ๋ณด์์ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๋ ๋ฐ์ง ๋ณด์(Dense Reward) ์ค๊ณ + Epsilon-Greedy + ์์ด์ ํธ-ํ๊ฒฝ ๋ถ๋ฆฌ OOP ์ํคํ ์ฒ.
5๏ธโฃ Data Engineering & Domain Application โ GPU ๊ฐ์ ๋ฐ์ดํฐ ํ์ดํ๋ผ์ธ / ๋๋ฉ์ธ ํนํ ๋ถ์
rapids-dask-pipelineโ ๋๊ท๋ชจ ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ๋ณ๋ชฉ ํด์๋ฅผ ์ํด NVIDIA RAPIDS cuDF + Dask ๊ฒฐํฉ. CSV โ Parquet, CPU โ GPU ๋ก ์ ์ฅ ํฌ๋งท๊ณผ ์ฐ์ฐ ์์ง์ ํจ๊ป ์ต์ ํ, MapReduce DAG ์๊ฐํ๋ก Lazy Evaluation ํจ์จ์ฑ ์ ์ฆ.road-network-graph-analyticsโ NVIDIA cuGraph ๋ก ์๊ตญ ๋๋ก๋ง (1,225 ๋ ธ๋ / 2,622 ์ฃ์ง) ๊ทธ๋ํ ๋ถ์. Dijkstra SSSP + 5์ข ์ค์ฌ์ฑ (Betweenness ยท Eigenvector ยท PageRank ยท Katz ยท Degree) ๋น๊ต๋ก ์ค๋ฌด ์ธ์ฌ์ดํธ ๋์ถ.skhynix-stock-analysisโ ๋ฐ๋์ฒด ๋๋ฉ์ธ ์ง์์ ๊ฒฐํฉํ SKํ์ด๋์ค ์ฃผ๊ฐ ์์ธก. Bidirectional LSTM + ๊ธฐ์ ์ ์งํ (MA/RSI/Bollinger/MACD) + Huber Loss, ๋ฐ์ดํฐ ๋ถํฌ ๋ณํ์ ๋ํ ๋ชจ๋ธ ํ๊ณ์ ๊ฐ๊ด์ ์ธ์ .
-
โญ
MIND-CARE-Conversational-ChatBotโ ๋ ๊ฑฐ๋ ธ์ธ ์ผ์ด์ฉ ์จ๋๋ฐ์ด์ค HRI ์์คํ '๋ง์๋๋ด'. ํด๋ผ์ฐ๋ ์์กด ์์ด NVIDIA Jetson AGX Xavier ํ ๋ ์์ ์์ฑยท์ธ์ดยท๋น์ ์ถ๋ก ์ ์ ๋ถ ๋ก์ปฌ ์คํํ๋ ํ๋ก๋์ ๊ธ ์์คํ . ROS 2 ๊ธฐ๋ฐ 4๊ฐ ๋์จํ ๊ฒฐํฉ ์๋ธ์์คํ (์์ฑ๋ํ STTโLLMโTTS ยท ๋น์ ยท ์๊ธ ์ํ๋จธ์ ยท WebSocket API ๊ฒ์ดํธ์จ์ด) ์ผ๋ก ๋ชจ๋ํ. LLM ์ EXAONE-3.5-7.8B-Instruct ๋ฅผ GGUF ์์ํ (Q3_K_M ์๋ / Q4_K_M ํ์ง) + llama.cpp ๋ถ๋ถ GPU offload, ์๋ฃ ์ง์์ ChromaDB + ์์ธ์์ฐ๋ณ์ ์งํ ๋ฐฑ๊ณผ ๊ธฐ๋ฐ RAG ๋ก ์ฌ์ค ๊ทผ๊ฑฐ ์ ๊ณต. ๋์ ๊ฐ์ง๋ YOLOv8n-pose (TensorRT FP16) ๊ณจ๊ฒฉ ์ถ์ถ ํ frame-level + ์๊ฐ์ ํ์ธ 2-stage ๊ฒ์ฆ ์ผ๋ก ์๊ธฐยท์์ด๊ธฐ ์คํ์ ์ต์ โ Recall 0.77 / Precision 0.68 (URFDD). '๊ฒฝ๋ณด ์ ์ง๋ฌธ(query-before-alert)' ๋ก์ง ยท ์ง๋จ/ํฌ์ฝ ๊ธ์ง ํ๋กฌํํธ ๋ฑ false negative ๋ฐฉ์ง๋ฅผ ์ฐ์ ํ ์์ ์ค๊ณ, GPIOยทFCMยทSMS ๋ค์ค ์ฑ๋ ๋ณดํธ์ ์๋ฆผ๊ณผ Flutter ๋ชจ๋ฐ์ผ ์ฑ๊น์ง ์๋ํฌ์๋ ์์ฑ. -
โญ
Fashion-King-Virtual-Fittingโ 360ยฐ ๊ฐ์ ํผํ ๊ณผ AI ์์ ์ถ์ฒ์ ๊ฒฐํฉํ ์น ํจ์ ์๋ฎฌ๋ ์ดํฐ '๋ด์ผ์ ํจ์ ์'. ์ฒดํ ์ฌ๋ผ์ด๋๋ก ๋ง๋ 3D ๋ง๋คํน์ ์ท์ ์ ํ 360ยฐ๋ก ๋๋ ค๋ณด๊ณ , ์ผ๊ตด ์ฌ์ง ํ ์ฅ์ผ๋ก ํผ์ค๋ ์ปฌ๋ฌ๋ฅผ ์ง๋จํด ์ด์ธ๋ฆฌ๋ ์ฝ๋ ์๊น์ง ์ถ์ฒํ๋ ์๋ํฌ์๋ ์์คํ . ํ๋ก ํธ๋ Next.js 14 + Three.js / React Three Fiber๋ก ์ฒดํ 7-ํ๋ผ๋ฏธํฐ ๋ง๋คํนยท์๋ฅ GLB ์คํค๋ยทOrbitControls 360ยฐ ํ์ ์ ์ค์๊ฐ ๋ ๋๋งํ๊ณ , ์ท ์ฌ์งโ๊ฐ์ ์ฐฉ์ฉ์ IDM-VTON ํฉ์ฑ ํ์ดํ๋ผ์ธ์ผ๋ก ์ฐ๋. ํต์ฌ ๋ด๋น ๋ชจ๋์ธ 2D ์์ ์ถ์ฒ ์์คํ ์ ResNet18 ๋ฉํฐํ์คํฌ CNN์ด ์ผ๊ตด์์ ์์ฟจยท๋ช ๋ยท์ ๋ช ๋ 3์ถ์ ํ๊ทํด ์ฌ๊ณ์ 12ํ์ ์ผ๋ก ๋ถ๋ฅ โ ์์ฆ ์ ํ๋ 90.4% / ํ์ 79.5% (์ถ MAE 0.14~0.27). ๋ผ๋ฒจ์ FairFace ์ฝํผ์ค์ SegFormer ํผ๋ถยท๋ชจ๋ฐ ์ธ๊ทธ๋ฉํ ์ด์ + 2-pass ๋ถํธ์คํธ๋ฉ์ผ๋ก ์ธ๊ตฌํต๊ณ ํธํฅ(ํผ๋ถ ํฉ์๋ยท๋ช ๋)์ ์ฝํผ์ค ํต๊ณ๋ก ๋ณด์ ํด ์๋ ์์ฑํ๊ณ , ์์ด ๊ณง ์ ํธ์ด๋ฏ๋ก ColorJitter ์ ์ฆ๊ฐ์ ๋ฐฐ์ (๊ธฐํ ์ฆ๊ฐ๋ง)ํด ๋ผ๋ฒจ ์ค์ผ์ ์ฐจ๋จ. ๋ฐฐํฌ๋ torch ์์ด ONNX Runtime๋ง์ผ๋ก ์ถ๋ก ํ๋ฉฐ mediapipe 1.25ร ์ผ๊ตด ํฌ๋กญ์ผ๋ก ํ์ต-์ถ๋ก ๋ถํฌ๋ฅผ ์ผ์น์์ผ ์ ํ๋ ์ ํ๋ฅผ ๋ฐฉ์ง. ์ถ์ฒ์ CIELab ฮE76 ์ง๊ฐ ๊ฑฐ๋ฆฌ๋ก ์์ฆ ํ๋ ํธ์ ์๋ฅ ์์ ๋น๊ตยท์ ๋ ฌ(ฮE<12 ์์ด์ธ๋ฆผ / <28 ๋ฌด๋), FastAPI/personal-color์๋ํฌ์ธํธ์ React ๊ฒฐ๊ณผ ํจ๋๊น์ง ์ฐ๋ ์์ฑ.
- Email:
910ehdbs@gmail.com - LinkedIn: linkedin.com/in/AD-Styles
- GitHub: github.com/AD-Styles
- Hugging Face: huggingface.co/AD-Styles