98woo
블로그로그인
최신인기
스마트폰으로 바이브코딩하기
바이브코딩

스마트폰으로 바이브코딩하기

스마트폰으로 원격 바이브코딩을 하는 방법이다. 운영체제별 환경 설정에 대한 차이도 기록했다.

31
2026.02.13
AI 모델 구축 (3) RAG
AI 서비스 구축

AI 모델 구축 (3) RAG

파인튜닝된 Llama 3.1이 일반 질문에도 학습 데이터에 치우치고 정확도가 들쑥날쑥해, 답변 강화를 위해 프론트 옵션으로 켜고 끌 수 있는 RAG를 도입했다. Spring이 bge-m3(Ollama)로 프롬프트를 1024차원 임베딩한 뒤 pgvector(PostgreSQL)에서 관련 청크를 검색해 프롬프트와 함께 LLM에 전달하며, 효과는 있었지만 긴 코드 생성의 디테일은 부족해 데이터 정제와 하이브리드 검색(BM25+벡터) 적용을 추가로 검토 중이다.

90
2026.01.30
AI 모델 구축 (2) QLoRA
AI 서비스 구축

AI 모델 구축 (2) QLoRA

Llama 3.1 8B 모델 파인 튜닝을 진행했다. Fast API 프레임워크 환경에서 수행했으며 QLoRA 방식으로 파인튜닝했다.

190
2026.01.22
AI 모델 구축 (1)
AI 서비스 구축

AI 모델 구축 (1)

사내 AI 서비스를 도입하려고 한다. 어떤 AI 모델을 사용하고, 아키텍처 구성은 어떻게 했는지에 대한 기록이다. 설치 과정도 함께 기록했다.

150
2026.01.21
VPN 적용기
VPN

VPN 적용기

네트워크 설정하면서 VPN 프로토콜을 변경하게 됐다. 현재 서버의 가장 적합한 VPN 프로토콜을 탐색하고 적용하는 과정에 대한 기록이다.

331
2026.01.05