전체 글 (310) 썸네일형 리스트형 Facebook MMS 모델로 한국어 TTS 웹 서비스 개발하기 Facebook MMS 모델로 한국어 TTS 웹 서비스 개발하기안녕하세요! 이번 글에서는 Facebook의 Massively Multilingual Speech (MMS) 프로젝트의 한국어 TTS 모델을 활용하여 텍스트를 자연스러운 한국어 음성으로 변환해주는 웹 서비스를 개발하는 방법을 알려드리겠습니다. 최신 LLM 기술과 허깅페이스의 모델을 활용하여 누구나 쉽게 따라할 수 있도록 설명해 드리겠습니다. 허깅페이스와 같은 AI 플랫폼에서 제공하는 최신 모델을 활용하면, 복잡한 딥러닝 모델을 직접 구현하지 않고도 고품질의 AI 서비스를 쉽게 개발할 수 있습니다. 서비스 시연 영상 확인하기~ : https://youtu.be/WL7Y5N-3qKs프로젝트 개요이 프로젝트는 텍스트를 입력하면 자연스러운 한국어 음.. 절대 이사가지 말아야 할 동네는? 강력범죄가 많은 곳은 어디!! 다음과 같은 지역별 범죄 현황에 대한 분석 서비스를 개발 하는 방법을 알려드립니다. 노코드로 개발하기 쉽도록, 아래 프롬프트를 복사해서 붙여넣기 쉽도록 제공합니다~ 시연 영상은 유튜브에 있습니다. https://youtu.be/jtwTQJmOBFI 1. 데이터 가져오기데이터를 가져오기 위해서, Perplexity (퍼플렉시티)에서 다음과 같은 프롬프트를 작성합니다.범죄 데이터를 얻을 수 있는 사이트 알려줘 위 결과에서, 첫번째 싸이트로 이동해서 다음과 같이 데이터를 얻어 옵니다. 2. 데이터 가공하기 사용한 프롬프트 첨부한 데이터를 지역별, 죄종별로 해당년도에 몇건의 범죄가 발생했는지 알수 있도록,년도를 컬럼으로해서 행렬 전환을 해줘.변환환 결과를 csv파일로 만들어줘. 결과 위의 데이터를 .. Google Domains(현 Squarespace) 도메인을 Vercel로 연결하기 Google Domains(현 Squarespace) 도메인을 Vercel로 연결하기최근 Google이 Google Domains 사업을 Squarespace로 매각하면서, 기존에 Google Domains를 사용하던 분들은 Squarespace에서 도메인 관리를 하게 되었습니다.이 포스트에서는 Google Domains(이제는 Squarespace) 도메인을 Vercel에 연결하여, 서브도메인으로 웹사이트를 호스팅하는 방법을 단계별로 설명합니다.1. Vercel 프로젝트 생성Vercel(https://vercel.com)에 접속한 뒤, 로그인합니다.New Project 버튼을 클릭하여 프로젝트를 생성합니다.GitHub, GitLab, Bitbucket 등을 연동하여 배포할 레포지토리를 선택할 수 있습니.. 16가지 AI 리드 생성 시스템 2025년을 강타할 16가지 미친 AI 리드 생성 시스템1. AI WhatsApp 참여 시스템 (Ricardo Bellorini)성과: 한 소규모 여행사가 한 달 만에 추가로 80,000 유로의 매출 달성작동 방식:기존의 ‘죽은 리드’를 대상으로 개인 맞춤형 WhatsApp 메시지 발송AI 에이전트가 대화를 이어가며 예약까지 진행비용: 초기 2,600 유로 + 월 150~200 유로특징: 광고비가 들지 않고 기존 데이터베이스만 활용해 수익 창출2. AI 챗봇 시스템 (Fahad Shedi)성과: 두 명의 대형 법률 인플루언서가 지난 3년간 얻은 리드보다 3개월 동안 더 많은 리드 확보작동 방식:웹사이트, 인스타그램, 메신저에서 AI 에이전트를 통해 실시간 상담동정심 있는 대응으로 자연스럽게 리드 캡처비용.. Claude Code 소개 및 기능 설명 Claude Code 소개 및 기능 설명Claude Code는 AI 기반의 혁신적인 코딩 도구로, 터미널에서 직접 사용할 수 있는 연구 프리뷰 버전입니다. 이 도구는 Claude AI를 활용하여 코드베이스를 분석하고, 코드 변경을 수행하며, 테스트를 실행하고, 빌드를 진행하는 등 다양한 기능을 제공합니다.1. Claude Code의 개요Claude Code는 터미널 환경에서 직접 실행되며, 사용자의 코드 프로젝트를 분석하고 필요한 변경 사항을 자동으로 적용하는 에이전트형 코딩 도구입니다. AI가 코드를 이해하고 변경 사항을 제안하며, 테스트와 빌드 과정을 자동으로 처리할 수 있습니다.2. 기본 사용 방법1) 프로젝트 로딩 및 분석Claude Code는 사용자의 프로젝트 파일을 확인한 후, 코드베이스를 분.. TheoremExplainAgent: Towards Multimodal Explanations for LLM Theorem Understanding TheoremExplainAgent: AI 기반 다중 모달 정리 설명 시스템개요TheoremExplainAgent는 AI를 활용하여 수학, 물리, 화학, 컴퓨터 과학 등의 다양한 STEM 분야에서 정리를 설명하는 장문의 애니메이션 동영상을 자동 생성하는 시스템입니다. 기존의 대형 언어 모델(LLM)은 텍스트 기반의 정리 이해 및 설명에 강점을 보였으나, 시각적으로 직관적인 설명을 제공하는 데 한계가 있었습니다. 본 연구에서는 AI가 정리 설명을 보다 효과적으로 수행할 수 있도록 다중 모달(텍스트+시각적 요소) 접근 방식을 적용하였습니다. 1. 연구 배경 및 필요성기존 LLM은 텍스트 기반 정리 설명에는 강하지만, 시각적인 직관성을 확보하기 어려움.수학, 물리학 등의 학문에서는 도형, 그래프, 시뮬레이션 .. GHOST 2.0: generative high-fidelity one shot transfer of heads GHOST 2.0: 한 번의 시도로 정밀한 머리 교체 (Generative High-fidelity One Shot Transfer of Heads) 개요최근 얼굴 교체(face swap)에 대한 연구가 활발하게 진행되고 있지만, 머리 전체를 교체하는(head swap) 연구는 아직 미흡합니다. 얼굴 교체는 피부색 변환만 필요하지만, 머리 교체는 머리 전체의 형태를 유지하고 배경과 자연스럽게 합성하는 것이 중요합니다.GHOST 2.0은 이러한 문제를 해결하기 위해 개발된 모델로, 두 가지 핵심 모듈을 포함합니다:Aligner: 원본(head source)의 머리를 목표(target)의 움직임에 맞춰 재현Blender: 생성된 머리를 대상 이미지와 자연스럽게 합성하여 피부색을 맞추고 불일치 영역을 채움연.. Kanana: Compute-efficient Bilingual Language Model Kanana: 효율적인 한국어 및 영어 이중 언어 모델개요Kanana는 한국어와 영어에서 뛰어난 성능을 발휘하는 이중 언어 모델 시리즈입니다. 이 모델은 유사한 크기의 최첨단 모델들과 비교해도 경쟁력이 있으며, 특히 연산 비용이 크게 절감되었습니다. 보고서에서는 Kanana 모델의 사전 훈련 및 후처리 과정에서 사용된 기술들을 설명하며, 특정 시나리오(예: 임베딩, 검색 강화 생성, 함수 호출)에 맞게 적응하는 방법도 제시합니다.1. 도입 배경최근 대형 언어 모델(LLM)의 발전은 방대한 학습 데이터와 모델의 크기를 증가시키는 방향으로 진행되었습니다. 하지만, 이러한 접근 방식은 높은 연산 비용을 유발하며, 이는 연구 및 산업에서 독자적인 LLM을 개발하는 데 장애 요인이 됩니다. Kanana는 이러한 .. 이전 1 ··· 10 11 12 13 14 15 16 ··· 39 다음