본문 바로가기

728x90

Programming/Python

(19)
[Pandas] categorical data type(범주형 데이터 타입)이란? (category datatype 사용 예제, pandas.Series.cat 사용법) pandas에서 사용하는 데이엍 타입은 아래와 같다. 이 중에서 Pandas에만 있고, python, numpy에는 없는 category 타입에 대해서 간단하게 알아보자. category 타입이란 text 값의 유한한 리스트를 표현할 때 사용하는 데이터 타입이다. 이렇게 말하면 잘 이해가 안갈 수 있는데 예를 살펴보면 간단하다. 사이즈 (X-Small, Small, Medium, Large, X-Large) 색깔 (빨강, 검정, 흰색) 스타일 (반팔, 긴팔) pandas에서는 category 데이터를 어떻게 표현할 수 있는걸까? category data type은 hybrid data type이다. 보기에는 string처럼 보이나 내부적으로는 integer의 배열로 표현이 되어있다. 이를 통해 사용자가 ..
[Python 3.x] 바이트 스트림(byte-stream) 객체의 등장 Yelp Dataset을 csv로 변환하는 코드가 python 2.x로 짜여있어서 만나게 된 오류..! 파이썬 코드를 돌리다보면 2.x와 3.x 간의 버전 차이로 오류가 나는 부분이 상당히 자주 있다. 예전에는 단순히 구글링해서 코드만 돌아가게 바꾸고 넘어갔는데 어떤 차이 때문에 발생한건지 이해하면 더 좋을 것 같아서 정리해본다. 오늘 내가 만난 오류는 바로 아래와 같다. TypeError: a bytes-like object is required, not 'str' 이는 바로 3.x에서는 "바이트 스트림 문자열 상수(리터럴)"가 생겼기 때문이라고 한다. 많은 함수들이 기존 문자열 대신 이 바이트 스트림을 사용하고 있다고 한다. 그렇다면 바이트 스트림(Byte-stream)이란 무엇일까? 말 그대로 바이..
PyG 란? PyG Documentation — pytorch_geometric 2.0.2 documentation PyG Documentation In addition, it consists of easy-to-use mini-batch loaders for operating on many small and single giant graphs, multi GPU-support, a large number of common benchmark datasets (based on simple interfaces to create your own), and helpful tr pytorch-geometric.readthedocs.io Pytorch는 딥러닝을 공부하는 분들이라면 다들 알고 있겠지만 PyG(pytorch_ge..

728x90