일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- Array operations
- 카테고리분포 MLE
- BOXPLOT
- 딥러닝
- groupby
- 정규분포 MLE
- Python
- 가능도
- linalg
- namedtuple
- 표집분포
- pivot table
- unstack
- ndarray
- Comparisons
- subplot
- python 문법
- boolean & fancy index
- 최대가능도 추정법
- 부스트캠프 AI테크
- Numpy data I/O
- dtype
- scatter
- Numpy
- seaborn
- VSCode
- Python 유래
- Operation function
- type hints
- Python 특징
- Today
- Total
목록분류 전체보기 (160)
또르르's 개발 Story
보호되어 있는 글입니다.

1️⃣ 그래프 신경망 그래프 신경망은 그래프와 정점의 속성 정보를 입력으로 받습니다. 그래프의 인접 행렬을 A라고 합시다. 인접 행렬 A 은 |𝑉| × |𝑉|의 이진 행렬입니다 각 정점 𝑢의 속성(Attribute) 벡터를 $𝑋_{𝑢}$라고 합시다. 정점 속성 벡터 $𝑋_{𝑢}$는 𝑚차원 벡터이고, 𝑚은 속성의 수를 의미합니다. 그래프 신경망은 이웃 정점들의 정보를 집계하는 과정을 반복하여 임베딩을 얻습니다. 아래 그림처럼 대상 정점의 임베딩을 얻기 위해 이웃들 그리고 이웃의 이웃들의 정보를 집계합니다. A가 우리가 얻고자 하는 대상 정점일때, A(대상 정점) -> 한 단계 인접한 그래프 정보 집계 -> 2단계 인접한 그래프 정보 집계를 차례차례 수행합니다. (여기서 2단계를 집계할 때 A가 다시 등장하..
1️⃣ 설정 Surprise 모듈을 설치합니다. !pip install surprise 필요한 모듈을 import 합니다. import numpy as np import pandas as pd from surprise import SVD # 잠재 인수 모형 from surprise.model_selection import train_test_split from surprise.dataset import DatasetAutoFolds from surprise.model_selection import cross_validate # hyperparameter 찾기 from surprise import Dataset, Reader from surprise import accuracy 2️⃣ 데이터셋 확인하기 데..
Node2vec은 임의보행 기반 접근법에서 2차 치우친 임의보행(Second-order Biased Random Walk)을 사용한 모형입니다. 1️⃣ 설정 networkx와 node2vec을 설치합니다. !pip install networkx !pip install node2vec 필요한 모듈을 import 합니다. import networkx as nx from node2vec import Node2Vec from matplotlib import pyplot as plt 2️⃣ node2vec 1) Node2Vec 함수 Node2Vec 함수는 edge 별 확률 계산(p, q에 따른 edge별 확률 계산) & random walk 생성을 해줍니다. dimensions : embedding 공간 차원 w..

2006년부터 2009년까지 넷플릭스에서는 "넷플릭스 챌린지 (Netflix Challenge)"라는 대회가 개최되었고, 총 2700개의 팀이 참여했습니다. 이 대회의 목적은 추천시스템의 성능을 10% 이상 향상시키는 것이었습니다. 즉, 평균 제곱근 오차 0.9514을 0.8563까지 낮출 경우 100만불의 상금을 받는 조건이었습니다. 넷플릭스 챌린지(Netflix Challenge)에서는 사용자별 영화 평점 데이터가 사용되었는데, 2000년부터 2005년까지 수집한 48만명 사용자의 1만 8천 개의 영화에 대한 1억 개의 평점을 사용했습니다. 넷플릭스는 "넷플릭스 챌린지"를 통해 추천시스템의 성능이 비약적으로 발전했습니다. 그렇다면 "넷플릭스 챌린지"에서 나왔던 모형들은 무엇일까요? 1️⃣ 잠재 인수 ..

1️⃣ 정점 표현 학습 정점 표현 학습이란 그래프의 정점들을 벡터의 형태로 표현하는 것입니다. 정점 표현 학습은 간단히 정점 임베딩(Node Embedding)이라고도 부릅니다. 정점 임베딩은 벡터 형태의 표현 그 자체를 의미하기도 합니다. 정점이 표현되는 벡터 공간을 임베딩 공간이라고 부릅시다. 정점 표현 학습의 입력은 그래프입니다. 주어진 그래프의 각 정점 𝑢에 대한 임베딩, 즉 벡터 표현 $𝒛_{𝑢}$가 정점 임베딩의 출력입니다. 정점 임베딩의 결과로, 벡터 형태의 데이터를 위한 도구들을 그래프에도 적용할 수 있습니다. 군집 분석 알고리즘(K-Means, DBSCAN 등), 정점 분류(Node Classification), 군집 분석(Community Detection) 등등.. 그렇다면 어떤 기준..

1️⃣ 설정 필요한 모듈을 import 합니다. import numpy as np import pandas as pd from sklearn.metrics import mean_squared_error # MSE를 계산하기 위하여 2️⃣ 데이터셋 확인하기 데이터셋은 다음과 같은 형태로 구성되어 있습니다. ratings.csv : 평점 ### Rating Dataset Format ### userId movieId rating timestamp 0 1 1 4.0 964982703 1 1 3 4.0 964981247 2 1 6 4.0 964982224 3 1 47 5.0 964983815 4 1 50 5.0 964982931 movies.csv : 영화 ### Movie Dataset Format ### C..

1️⃣ 설정 필요한 모듈을 import 합니다. import matplotlib.pyplot as plt # 그래프를 그리기 위한 라이브러리 import numpy as np import networkx as nx # 그래프의 기본적인 연산들을 위한 라이브러리 from networkx.algorithms import community # modularity 계산을 위한 라이브러리 2️⃣ Girvan-Newman Algorithm 1) 전체 코드 def GirvanNewmanAlgorithm(G, nodeColorList): copyG = G.copy() # 기존 그래프를 복사하여, 복사된 그래프를 사용하여 엣지를 하나씩 제거하는 작업을 진행한다. pos = nx.spring_layout(copyG) ""..

추천 시스템은 사용자 각각이 구매할 만한 혹은 선호할 만한 상품/영화/영상을 추천합니다. 추천 시스템의 핵심은 사용자별 구매를 예측하거나 선호를 추정하는 것입니다. 그래프 관점에서 추천 시스템은 “미래의 간선을 예측하는 문제” “누락된 간선의 가중치를 추정하는 문제” 로 해석할 수 있습니다. 1️⃣ 내용 기반 추천시스템 내용 기반(Content-based) 추천은 각 사용자가 구매/만족했던 상품과 유사한 것을 추천하는 방법입니다. 내용 기반 추천은 다음 네 가지 단계로 이루어집니다. 1) 사용자가 선호했던 상품들의 상품 프로필(Item Profile)을 수집하는 단계 어떤 상품의 상품 프로필이란 해당 상품의 특성을 나열한 벡터입니다. 영화의 경우 감독, 장르, 배우 등의 원-핫 인코딩이 상품 프로필이 될..

1️⃣ 군집의 정의 군집(Community)이란 다음 조건들을 만족하는 정점들의 집합입니다. (1) 집합에 속하는 정점 사이에는 많은 간선이 존재합니다. (2) 집합에 속하는 정점과 그렇지 않은 정점 사이에는 적은 수의 간선이 존재합니다. 그래프를 여러 군집으로 나누는 문제를 군집 탐색(Community Detection) 문제라고 합니다. 2️⃣ 군집성 1) 배치 모형 (Configuration Model) 배치 모형(Configuration Model)은 다음과 같은 그래프를 의미합니다. 1) 각 정점의 연결성(Degree)을 보존한 상태 2) 간선들을 무작위로 재배치하여서 얻음 배치 모형에서 임의의 두 정점 𝑖와 𝑗 사이에 간선이 존재할 확률은 두 정점의 연결성에 비례합니다 2) 군집성(Modula..