🔰 개요제품 설명 텍스트만을 가지고 가격을 예측하는 머신러닝 모델을 실험해 봅니다.Baseline 모델부터 시작해서 BOW, Word2Vec, SVR, 랜덤 포레스트까지 점진적으로 성능을 개선해 나가는 과정을 코드와 함께 단계별로 정리합니다.7. 📈 수치형 특성을 활용한 선형 회귀 실험📈 선형 회귀(Linear Regression)를 이용한 가격 예측아래는 전통적인 선형 회귀 모델을 학습하고 평가하는 전체 코드이며,feature들을 실제 회귀 모델에 넣어 가격 예측 실험을 해보는 단계입니다.# 📈 전통적인 선형 회귀 모델 실험np.random.seed(42)# 🔒 무작위성 제어 (결과 재현 가능하도록 시드 고정)# 🧩 입력 특성과 타깃 변수 분리feature_columns = ['weight'..
🔰 개요제품 설명 텍스트만을 가지고 가격을 예측하는 머신러닝 모델을 실험해 봅니다.Baseline 모델부터 시작해서 BOW, Word2Vec, SVR, 랜덤 포레스트까지 점진적으로 성능을 개선해 나가는 과정을 코드와 함께 단계별로 정리합니다.📦 1. 라이브러리 임포트 및 환경 설정🛠️ 코드 임포트 및 환경 설정# 📁 파일 및 환경 설정 관련 라이브러리import os # 📂 파일 경로, 환경 변수 등 시스템 관련 작업을 할 때 사용import math # ➗ 수학 계산 (루트, 로그 등)에 필요한 함수들 제공import json # 📄 JSON 형식 파일 읽기/쓰기 작업에 사용# 🎲 랜덤 처리 관련imp..
LLM을 위한 제품 설명 데이터 세부 조정 기술📌 실습 목표Hugging Face의 Amazon 리뷰 데이터셋을 활용하여 제품 설명 기반 가격 예측 모델을 만들기RAG/LLM 기반 모델 훈련을 위한 데이터 전처리 및 프롬프트 구성 실습🧱 1. 실습 환경 설정🧪 필요한 라이브러리 임포트# 📦 기본 라이브러리 임포트import os # 🧭 환경 변수(.env) 경로 및 파일 관리를 위한 표준 라이브러리from dotenv import load_dotenv # 🔐 .env 파일에 저장된 API 키 등의 환경 변수 로딩용from huggingface_hub import login # 🤝 Hugging Face Hub에 로그인하여 인증 토큰 사용 가능하게 함from datasets import ..
🧠 LangChain + FAISS + Gradio로 만드는 RAG 기반 지식 챗봇문서를 검색해 대화형으로 응답해 주는 RAG 기반 지식 챗봇을 만들어보는 프로젝트입니다.OpenAI의 LLM을 기반으로 벡터 검색, 대화 메모리, 웹 인터페이스까지 연결하며 실습하였습니다.5. 🎯 FAISS 벡터 추출 및 시각화 준비이 코드는 FAISS 벡터 저장소에서 벡터와 메타데이터를 꺼내어 시각화를 준비하는 부분입니다.# 🎯 시각화를 위한 사전 준비 단계 (FAISS 저장소에서 벡터 및 메타데이터 추출)vectors = [] # 벡터들을 담을 리스트documents = [] # 문서 원문을 담을 리스트doc_types = [] # 문서 유형(폴더 이름 등)을 담을 리스트colors = [] ..