'분류 전체보기' 카테고리의 글 목록 (3 Page)

문서 기반 챗봇 만들기: RAG 실습 with OpenAI, FAISS, Gradio 01

2025.04.28

🧠 LangChain + FAISS + Gradio로 만드는 RAG 기반 지식 챗봇문서를 검색해 대화형으로 응답해 주는 RAG 기반 지식 챗봇을 만들어보는 프로젝트입니다.OpenAI의 LLM을 기반으로 벡터 검색, 대화 메모리, 웹 인터페이스까지 연결하며 실습하였습니다.🔍 FAISS란 무엇인가요?FAISS는 Facebook AI Similarity Search의 약자로, Facebook AI Research에서 개발한 벡터 유사도 검색 라이브러리입니다.대규모 벡터 데이터에서 유사한 항목을 빠르게 검색할 수 있어, 문서 검색 기반 생성(RAG) 시스템에 매우 적합합니다.1. 📦 필수 라이브러리 임포트🔹 주요 라이브러리 설명import os, globfrom dotenv import load_dote..

🧠 LLM 엔지니어링

LangChain과 Chroma를 활용한 문서 임베딩 시각화 실습 02

2025.04.27

🧠 LangChain + Chroma + t-SNE로 문서 임베딩 시각화하기문서를 벡터로 변환하고 시각화하여 RAG 검색의 기반을 시각적으로 이해해 보는 실습입니다.🔌 9. 벡터 임베딩 모델 설정이 코드는 각 문서 청크를 의미 기반 벡터로 변환해서 벡터 저장소에 넣기 위한 사전 준비 단계입니다.# 🧠 문서 청크들을 벡터 임베딩으로 변환하여 벡터 저장소(Vector Store)에 넣기 위한 준비embeddings = OpenAIEmbeddings()# 🔹 OpenAI의 임베딩 모델 사용 설정# - 각 텍스트 청크를 의미 기반 벡터로 변환# - 이 벡터는 RAG 검색에서 유사도 비교 기준으로 사용됨# - OpenAI API 키가 필요하며, 비용이 발생할 수 있음# 💡 참고: HuggingFace의 ..

🧠 LLM 엔지니어링

LangChain과 Chroma를 활용한 문서 임베딩 시각화 실습 01

2025.04.26

🧠 LangChain + Chroma + t-SNE로 문서 임베딩 시각화하기문서를 벡터로 변환하고 시각화하여 RAG 검색의 기반을 시각적으로 이해해 보는 실습입니다.📦 1. 필수 라이브러리 임포트import os # 🧭 파일 경로 탐색 및 환경 변수 관리용 표준 라이브러리import glob # 📂 폴더 내 특정 패턴의 파일을 한 번에 가져올 때 사용 (예: *.txt)from dotenv import load_dotenv # 🔐 .env 파일에 저장된 환경변수(예: API 키) 불러오는 함수import gradio as gr # 🧑‍💻 Gradio 라이브러리 - 웹 UI를 손쉽게 만들 수 있음 (LLM 챗봇 인터페이스 구축 시 사용)?..

🧠 LLM 엔지니어링

LLM 문서에서 특정 키워드 추출하는 방법 02 (Shopwise 지식기반 예제)

2025.04.25

LLM에 넣기 좋은 문서를 만들기 위한 LangChain 문서 청크 분할 가이드 (chunk_size & overlap 이해하기)# ✂️ 문서를 LLM 입력에 맞게 청크(chunk) 단위로 분할하는 단계# - 긴 문서는 한 번에 LLM에 넣기 어렵기 때문에, 적절한 길이로 잘라야 함# - LangChain의 CharacterTextSplitter를 사용해 '문자 기준'으로 분할함text_splitter = CharacterTextSplitter( chunk_size=1000, # 📏 한 청크당 최대 1,000자까지 포함 chunk_overlap=200 # 🔁 청크 간에 200자씩 겹치도록 설정 (문맥 끊김 방지용))# 🧩 실제 분할 실행: documents 리스트 ..

문서 기반 챗봇 만들기: RAG 실습 with OpenAI, FAISS, Gradio 01

LangChain과 Chroma를 활용한 문서 임베딩 시각화 실습 02

LangChain과 Chroma를 활용한 문서 임베딩 시각화 실습 01

LLM 문서에서 특정 키워드 추출하는 방법 02 (Shopwise 지식기반 예제)

티스토리툴바