본문 바로가기

728x90

아키텍쳐

(3)
[AI CHAT BOT] 사용자 경험을 위한 RAG 답변 생성 최적화 개발 (병렬 처리, k값 수정 등) [AI CHAT BOT] 응답 속도 개선을 위한 스트리밍 설계, Next -> Nest -> Python 실시간 렌더링 Nest -> Python 실시간 렌더링" data-og-description="[Python] 멀티프로세싱으로 처리 속도 올리기 (multiprocessing)이전 글 읽으러 가기! 👋 소개안녕하세요! 대학생 개발자 주이어입니다! 저는 현재 진행 중인 프로젝트에서 단순히 GPT API를 호출해 답변" data-og-host="blog.juyear.dev" data-og-source-url="https://blog.juyear.dev/106" data-og-url="https://blog.juyear.dev/106" data-og-image="https://scrap.kakaocdn...
[AI CHAT BOT] 응답 속도 개선을 위한 스트리밍 설계, Next -> Nest -> Python 실시간 렌더링 [Python] 멀티프로세싱으로 처리 속도 올리기 (multiprocessing)이전 글 읽으러 가기! 👋 소개안녕하세요! 대학생 개발자 주이어입니다! 저는 현재 진행 중인 프로젝트에서 단순히 GPT API를 호출해 답변을 받는 구조로 챗봇을 제작하고 있었습니다.하지만 서버 배포 후 테스트 과정에서 무료 vm의 낮은 성능과 콜드스타트 등의 문제 때문에 답변을 기다리는 시간이 너무 길어졌고,이는 사용자 경험을 현저히 떨어뜨리는 문제가 될 것이라고 생각했습니다. 저번 TRAIVEL 프로젝트에서도 비슷한 문제가 있었지만 Next -> Express로 한 단계 통신이었기에 큰 문제가 되지 않았습니다.하지만 이번의 경우 RAG 방식을 사용한 Next -> Nest -> Python으로 두 단계 이상의 통신이었고..
[Express] 레이어드 아키텍쳐 구현하기 (Layered Architecture) 🚩 소개안녕하세요! 대학생 개발자 주이어입니다!오늘은 레이어드 아키텍쳐 구조화 방법을 사용하여 Express 폴더를 정리해보려고 합니다! 레이어드 아키텍쳐는 실무에서 자주 사용되는 백엔드 구조화 방식이니 한 번씩 읽고 가시길 바랍니다! 📌 레이어드 아키텍쳐란?레이어드 아키텍쳐는 애플리케이션의 구조를 여러 개의 계층(layer)으로 나누어 각 계층이 하나의 책임만을 가지도록 구성하는 소프트웨어 설계 방식입니다. 주로 백엔드에서 많이 사용되며, 각 계층은 아래와 같이 나눠집니다.계층설명Controller클라이언트 요청을 받고, 응답을 반환하는 역할Service실제 요청을 처리하는 역할ModelDB를 설계하거나, 직접 통신하는 역할RouteAPI 경로를 정의하고, 요청에 맞는 Controller에 연결하는..

728x90