유사도 측정 방법: Cosine, Dot Product, Euclidean
유사도 측정 방법: Cosine, Dot Product, Euclidean유사도 측정은 벡터 간의 관계를 수치화하여, 두 벡터가 얼마나 비슷한지를 나타냅니다. 주요 유사도 측정 방식인 Cosine Similarity, Dot Product, Euclidean Distance의 계산 방식과 특성을 아래에 정리했습니다. 유사도를 활용한 추천시스템 개발 : https://youtu.be/B5k0Iv-0mLY1. Cosine Similarity (코사인 유사도)개념두 벡터 간의 각도를 측정하여 유사도를 계산합니다.벡터의 크기는 무시하고, 방향(즉, 각도)에만 초점을 맞춥니다.1에 가까울수록 유사, -1에 가까울수록 비유사.공식cosine similarity=cos(𝜃)=𝐴⋅𝐵∥𝐴∥∥𝐵∥cosine s..
데이터 프레임의 정보 요약하기 : value_counts()
데이터 프레임의 정보 요약하기데이터 분석에서 데이터 프레임의 정보를 요약하는 것은 데이터의 구조와 내용을 이해하는 데 중요한 단계입니다. 판다스(Pandas) 라이브러리를 사용하면 데이터 프레임의 다양한 정보를 쉽게 요약할 수 있습니다. 이번 글에서는 데이터 프레임의 정보를 요약하는 방법에 대해 알아보겠습니다.데이터 프레임 생성우선 예제 데이터를 사용하여 데이터 프레임을 생성해보겠습니다.import pandas as pd# 샘플 데이터 생성data = { 'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Edward'], 'Age': [25, 30, 35, 40, 45], 'Salary': [50000, 60000, 70000, 80000, 90000]}d..
데이터 프레임의 기초 통계 계산: 평균,중앙값,최대,최소,표준편차,분산,사분위수
데이터 프레임의 기초 통계 계산데이터 분석에서 데이터의 기초 통계량을 파악하는 것은 매우 중요한 단계입니다. 판다스(Pandas) 라이브러리를 사용하면 데이터 프레임에서 다양한 기초 통계량을 쉽게 계산할 수 있습니다. 이번 글에서는 데이터 프레임의 기초 통계 계산 방법에 대해 알아보겠습니다.데이터 프레임 생성우선 예제 데이터를 사용하여 데이터 프레임을 생성해보겠습니다.import pandas as pd# 샘플 데이터 생성data = { 'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Edward'], 'Age': [25, 30, 35, 40, 45], 'Salary': [50000, 60000, 70000, 80000, 90000]}df = pd.Data..