반응형

전체 글 240

AWS 실전 LLM 셀프 호스팅 배포 가이드북

💡 실전 LLM 셀프 호스팅 배포 가이드북조직 또는 개인이 대규모 언어 모델(LLM)을 자체적으로 배포(Self-hosting)하고 운영할 때 필요한 핵심 지침을 정리한 실무 가이드입니다.📌 1. 왜 Self-Hosting을 고려해야 하는가?조건Self-hosting 고려 대상 여부대규모 트래픽을 처리하고 싶다✅ YesAPI 비용이 부담된다✅ Yes보안/컴플라이언스 이슈가 있다✅ Yes특정 도메인 특화 모델이 필요하다✅ Yes벡터 검색/임베딩 모델을 운영한다✅ Yes✅ 위 항목 중 하나라도 해당되면, self-hosting은 현실적인 대안이 될 수 있습니다.🚧 2. 배포 준비: 인프라 경계 정의🔍 배포 전에 다음 질문에 답해보세요:어느 정도의 GPU/CPU 자원을 쓸 수 있는가?목표 지연 시간(l..

AWS Cloud 02:42:20

Cursor IDE 초보자 가이드 : 설치 - 설정 - 샘플앱 개발 - 단축키

커서 IDE 완벽 가이드목차커서 IDE 소개설치 방법기본 인터페이스 둘러보기AI 기능 활용하기첫 프로젝트 만들기샘플 개발 예시: 간단한 웹 애플리케이션유용한 단축키문제 해결커서 IDE 소개커서 IDE는 AI 기반 코드 에디터로, VS Code를 기반으로 만들어진 강력한 개발 도구입니다. 코드 자동 완성, AI 코드 생성, 코드 설명 등 다양한 AI 기능을 제공하여 개발자의 생산성을 크게 향상시켜줍니다.주요 특징:AI 코드 자동 완성자연어로 코드 생성코드 설명 및 리팩토링 지원VS Code와 호환되는 인터페이스 및 확장 프로그램다양한 프로그래밍 언어 지원설치 방법커서 IDE 공식 웹사이트에 접속합니다.다운로드 버튼을 클릭하여 운영체제에 맞는 설치 파일을 다운로드합니다.Windows: .exe 파일macOS..

GitHub Copilot vs Cursor AI 어느게 더 낫지?

GitHub Copilot vs Cursor: 최고의 AI 코딩 어시스턴트는?최근 GitHub Copilot이 Visual Studio Code 유저를 위한 무료 요금제를 도입하면서, AI 코딩 어시스턴트 시장에서 다시금 주목받고 있습니다. 하지만 Cursor와 비교했을 때 과연 얼마나 경쟁력이 있을까요? 실제 테스트를 바탕으로 기능과 경험을 정리해보았습니다.✨ 멀티 파일 편집 기능Copilot의 'Edit with Copilot' 기능은 여러 파일을 동시에 편집할 수 있도록 해줍니다. 하지만 실제 테스트에서는 정확한 파일을 찾지 못하거나, 코드 수정이 제대로 되지 않는 문제가 발생했습니다.반면, Cursor는 자동으로 코드베이스를 스캔하고, 관련 파일을 빠르게 찾아내어 정확한 위치에 필요한 변경을 수행..

IT 최신 뉴스 2025.04.01

Vibe Coding - 셋업부터 고급 팁까지 프롬프트 사용법

바이브 코딩 튜토리얼 최근 개발 트렌드 중 하나로 급부상한 'Vibe 코딩'. 코드 한 줄 쓰지 않고도 AI 에이전트와 대화하면서 프로젝트를 구현하는 방식입니다.1. Vibe 코딩을 위한 툴 선택먼저 어떤 툴로 Vibe 코딩을 할지 정해야 합니다. 영상에서는 아래 네 가지 툴이 소개됩니다:Windsurf: VS Code를 포크한 코드 에디터로, Vibe 코딩에 최적화된 환경 제공. 최근 가장 많이 사용됨.Cursor: AI 기반 코딩 에디터로 Windsurf와 유사한 기능.VS Code 확장 (예: Klein): 기존 VS Code 사용자라면 확장만으로도 Vibe 코딩 가능.Replit: 온라인 코드 에디터로 배포까지 간편하게 가능.캔버스 기능 (Claude, ChatGPT 등): HTML/JS에 한정되..

IT 기술 용어 2025.04.01

Cursor AI 4가지 Rule 타입은 꼭 활용해야 한다

🎯 Cursor AI의 진화: 4가지 새로운 Rule 타입과 강력한 자동 생성 기능Cursor Rule 시스템이 대폭 강화되어, 이제 여러분이 원하는 방식대로 Cursor Agent를 훨씬 더 유연하게 활용할 수 있게 되었습니다. 그런데 놀랍게도 이 변화들은 공식 문서에 잘 드러나 있지 않습니다. 그래서 오늘은 여러분께 Cursor의 최신 기능과 실전 활용 팁을 정리해 드립니다.🆕 새롭게 추가된 4가지 Rule 타입Cursor는 이제 총 4가지의 Rule 타입을 지원합니다. 각각의 Rule은 AI Agent의 작동 방식에 큰 영향을 미치며, 다양한 자동화 시나리오에 활용될 수 있습니다.Rule 타입설명agent-selected에이전트가 **설명(description)**만 보고 필요 시 전체 규칙을 ..

AWS 트래픽 처리 - 면접질문

AWS를 사용하셨다고 했는데, 서비스에 트래픽이 몰릴 때는 어떻게 처리하셨나요?네, 트래픽 처리를 위해 Auto Scaling과 Application Load Balancer(ALB)를 사용했습니다.EC2 인스턴스는 Auto Scaling Group에 묶어서 CPU 사용률이 70% 이상일 때 인스턴스를 자동으로 확장하도록 설정했고, 요청은 ALB가 여러 인스턴스로 분산시켰습니다.  Auto Scaling 설정은 어떤 기준으로 구성하셨나요? CloudWatch를 사용해서 CPU 사용률이 70% 이상이면 인스턴스를 1개 추가하고, 30% 이하로 5분 이상 유지되면 1개를 줄이도록 설정했습니다.초기에는 요청 수(RequestCount)를 기준으로 했는데, CPU 기준이 좀 더 안정적이어서 바꾸게 되었습니다. ..

취준생대상 2025.03.28

GitHub Copilot의 백엔드 아키텍처 설계 방법

GitHub Copilot의 도전과 해결책설명 영상 링크 : https://youtu.be/M0Ev-mD5LsM근본적인 이유: 클라우드 AI와 로컬 IDE의 괴리GitHub Copilot이 직면한 여러 문제들의 근본적인 원인은 "AI 모델 기반 코드 자동완성을 IDE 수준의 속도로 제공해야 한다"는 근본적인 모순에 있습니다. 일반적인 IDE 자동완성은 로컬에서 즉시 실행되지만, AI 모델 추론은 클라우드에서 수행되어야 하기 때문에 네트워크 지연이 불가피합니다. 여기에 전 세계 사용자를 지원해야 하는 글로벌 서비스의 특성과 보안 요구사항까지 더해져 복잡한 기술적 도전이 발생했습니다.이러한 근본적인 모순에서 다음 세 가지 핵심 문제가 발생했습니다: 핵심 문제 3가지1. 네트워크 지연으로 인한 느린 응답 속도..

IT 최신 뉴스 2025.03.27

AI 가 발표자료를 검토해준다!

Gemini API 튜토리얼: Slides Advisor - AI 프레젠테이션 검토자 만들기이 튜토리얼에서는 Gemini API를 활용해 사용자의 프레젠테이션 슬라이드 내용을 요약 및 개선하는 AI 어시스턴트를 만드는 방법을 안내합니다.1. 개요사용자가 Google Slides 또는 텍스트 기반 슬라이드를 업로드Gemini가 콘텐츠의 품질을 분석하고 요약, 피드백, 개선 제안 제공발표자용 요약 스크립트 자동 생성 가능2. 기능 구성기능설명슬라이드 요약각 슬라이드의 핵심 내용을 요약개선 제안시각적 구성 및 텍스트 개선 제안발표 스크립트 생성발표자가 말할 수 있는 간결한 대본 제공3. 기술 스택Gemini API: 텍스트 분석 및 생성Google Slides API: 슬라이드 내용 추출Python (Flas..

Google Cloud Console에서 credentials.json 파일을 얻는 방법

Google Cloud Console에서 credentials.json 파일을 얻는 방법을 단계별로 설명해드리겠습니다:Google Cloud Console 접속Google Cloud Console에 접속합니다.Google 계정으로 로그인합니다. 프로젝트 생성상단의 프로젝트 선택 드롭다운 메뉴를 클릭합니다."새 프로젝트" 버튼을 클릭합니다.프로젝트 이름을 입력합니다 (예: "agent01-drive-api")."만들기" 버튼을 클릭합니다. Google Drive API 활성화왼쪽 메뉴에서 "API 및 서비스" > "라이브러리"를 선택합니다.검색창에 "Google Drive API"를 입력합니다.Google Drive API를 선택합니다."사용 설정" 버튼을 클릭합니다. OAuth 2.0 클라이언트 ID 생..

uv를 이용한 파이썬 가상환경 관리

uv를 이용한 파이썬 가상환경 관리파이썬 개발 환경을 관리하는 데 있어 uv는 최근 주목받고 있는 도구입니다. uv는 빠르고 효율적인 파이썬 버전 관리와 가상환경 생성을 지원하며, 기존의 pip, venv, poetry 등의 도구를 대체할 수 있는 기능을 제공합니다. 이 글에서는 uv를 사용하여 파이썬 가상환경을 생성하고 관리하는 방법에 대해 설명합니다.uv란 무엇인가?uv는 Rust로 작성된 빠른 Python 패키지 및 프로젝트 관리자입니다. uv는 기존의 도구들보다 더 빠른 성능과 간편한 사용법을 제공하여 개발자들이 프로젝트 관리에 소요되는 시간을 줄일 수 있도록 돕습니다. 각 컴퓨터에 uv를 설치하는 방법을 알려드리겠습니다. 운영 체제별로 설치 방법이 다릅니다:Windows: textpowershe..

Python 2025.03.25
반응형