'DataScience' 카테고리의 글 목록

쿠폰은 아무나 막 주는게 아니다 : K-Means 클러스터링 이란? CRM 고객분석 / 타겟 마케팅

머신러닝 기반 CRM 타겟 마케팅 대시보드Why?? - CRM 안하는 회사는 망하니깐!!오늘날 기업들은 수많은 고객 데이터를 보유하고 있지만, 이를 효과적으로 활용하는 것은 여전히 큰 도전과제입니다. 특히 고객의 구매 패턴과 행동 양식을 이해하고 이에 맞춘 타겟 마케팅을 진행하는 것은 마케팅 효율성과 고객 경험 향상에 필수적입니다. 이번 블로그에서는 비지도 학습(Unsupervised Learning)의 한 종류인 클러스터링 기법을 활용한 CRM 타겟 마케팅 대시보드를 소개합니다.비지도 학습(Unsupervised Learning)과 고객 세그먼테이션왜 비지도 학습인가?마케팅에서 고객을 분류할 때, 우리는 데이터 자체에서 패턴을 발견해야 합니다. 바로 이 지점에서 비지도 학습의 강점이 드러납니다. 레이블..

DataScience 2025. 3. 24. 16:03

데이터 파이프라인 구축과 자동화

데이터 파이프라인 구축과 자동화데이터 파이프라인은 데이터의 수집, 처리, 저장, 분석을 일관되게 수행할 수 있도록 설계된 시스템입니다. 특히 빅데이터 환경에서는 방대한 데이터를 효과적으로 관리하고 분석하기 위해 신뢰성 높은 데이터 파이프라인의 구축과 자동화가 필수적입니다. 이 글에서는 데이터 파이프라인 구축과 자동화의 핵심 요소를 전문가 수준에서 다루고자 합니다.1. 데이터 파이프라인의 개념데이터 파이프라인은 원천 데이터(Source)로부터 데이터를 수집하고, 이를 가공하여 데이터 웨어하우스나 데이터 레이크에 저장한 후, 분석 시스템으로 전달하는 일련의 과정을 의미합니다.데이터 파이프라인의 주요 구성 요소:데이터 수집(Source Ingestion): 로그, API, 데이터베이스 등 다양한 원천으로부터 ..

DataScience 2025. 2. 24. 22:03

유사도 측정 방법: Cosine, Dot Product, Euclidean

유사도 측정 방법: Cosine, Dot Product, Euclidean유사도 측정은 벡터 간의 관계를 수치화하여, 두 벡터가 얼마나 비슷한지를 나타냅니다. 주요 유사도 측정 방식인 Cosine Similarity, Dot Product, Euclidean Distance의 계산 방식과 특성을 아래에 정리했습니다. 유사도를 활용한 추천시스템 개발 : https://youtu.be/B5k0Iv-0mLY1. Cosine Similarity (코사인 유사도)개념두 벡터 간의 각도를 측정하여 유사도를 계산합니다.벡터의 크기는 무시하고, 방향(즉, 각도)에만 초점을 맞춥니다.1에 가까울수록 유사, -1에 가까울수록 비유사.공식cosine similarity=cos⁡(𝜃)=𝐴⋅𝐵∥𝐴∥∥𝐵∥cosine s..

DataScience 2025. 1. 5. 18:54

인공지능과 데이터 분석: 초보자 학습 방법

인공지능과 데이터 분석: 시작하기🌟 **인공지능(AI)**과 데이터 분석은 현대 사회의 필수 기술로 자리 잡았습니다.기업은 데이터를 기반으로 전략을 세우고, AI를 활용해 더 스마트한 의사결정을 내리고 있습니다.여러분도 이 기술들을 배워 직접 프로젝트를 구현하거나 새로운 비즈니스 아이디어를 발전시킬 수 있습니다.이번 글에서는 AI와 데이터 분석의 기본 개념,실질적인 사용 사례, 그리고**입문자들을 위한 학습 가이드**를 소개합니다. 1. 인공지능과 데이터 분석의 차이인공지능(AI)이란? 🤖AI는 컴퓨터가 인간처럼 학습하고 사고하며 문제 해결을 할 수 있도록 만드는 기술입니다.이를 통해 자연어 처리, 이미지 인식,**예측 모델 생성**과 같은 다양한 작업이 가능합니다.예시: 챗봇, 음성 인식 시스템,..

DataScience 2024. 12. 3. 12:50

데이터 프레임의 정보 요약하기 : value_counts()

데이터 프레임의 정보 요약하기데이터 분석에서 데이터 프레임의 정보를 요약하는 것은 데이터의 구조와 내용을 이해하는 데 중요한 단계입니다. 판다스(Pandas) 라이브러리를 사용하면 데이터 프레임의 다양한 정보를 쉽게 요약할 수 있습니다. 이번 글에서는 데이터 프레임의 정보를 요약하는 방법에 대해 알아보겠습니다.데이터 프레임 생성우선 예제 데이터를 사용하여 데이터 프레임을 생성해보겠습니다.import pandas as pd# 샘플 데이터 생성data = { 'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Edward'], 'Age': [25, 30, 35, 40, 45], 'Salary': [50000, 60000, 70000, 80000, 90000]}d..

DataScience 2024. 8. 1. 12:32

데이터 프레임의 기초 통계 계산: 평균,중앙값,최대,최소,표준편차,분산,사분위수

데이터 프레임의 기초 통계 계산데이터 분석에서 데이터의 기초 통계량을 파악하는 것은 매우 중요한 단계입니다. 판다스(Pandas) 라이브러리를 사용하면 데이터 프레임에서 다양한 기초 통계량을 쉽게 계산할 수 있습니다. 이번 글에서는 데이터 프레임의 기초 통계 계산 방법에 대해 알아보겠습니다.데이터 프레임 생성우선 예제 데이터를 사용하여 데이터 프레임을 생성해보겠습니다.import pandas as pd# 샘플 데이터 생성data = { 'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Edward'], 'Age': [25, 30, 35, 40, 45], 'Salary': [50000, 60000, 70000, 80000, 90000]}df = pd.Data..

DataScience 2024. 8. 1. 12:16

일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

Data Vision

티스토리툴바