Jam's story

목차 칼럼명 뽑기 본문

2021-2학기/데이터분석

목차 칼럼명 뽑기

애플쩀 2022. 3. 23. 12:11

판다스(pandas) 기본 사용법 익히기 (dandyrilla.github.io) 참고

행-index, 열 -columns

행에 해당하는 기준(첫번째 기준)인 인덱스를 index 라는 인수로 전달하며, 열에 해당하는 기준(두번째 기준)인 컬럼을 columns 이라는 인수로 전달합니다

DataFrame의 인덱스를 보려면 .index 속성을, 컬럼을 보려면 .columns 속성을, 안에 들어있는 numpy 데이터를 보려면 .values 속성을 통해 확인하면 됩니다.

.describe() 메소드는 생성했던 DataFrame 의 간단한 통계 정보를 보여줍니다.

.T 속성은 DataFrame 에서 index 와 column 을 바꾼 형태의 DataFrame 입니다.

.sort_index() 라는 메소드로 행과 열 이름을 정렬하여 나타낼 수도 있습니다.

정렬할 대상 축을 결정할 때에는 axis 를 이용합니다. axis=0 라고 써주면 인덱스를 기준으로 정렬하며(기본값), axis=1 라고 써주면 컬럼을 기준으로 정렬합니다. 정렬의 방향에 대한 파라미터는 ascending 를 이용합니다. ascending=True 는 오름차순 정렬을 하겠다는 것이고(기본값), ascending=False 는 내림차순 정렬을 하겠다는 의미입니다. 다음은 컬럼에 대하여 내림차순 정렬을 하는 예제입니다.

] 슬라이싱 기능을 이용하는 방법입니다. 특정 ‘컬럼’의 값들만 가져오고 싶다면 df['A']와 같은 형태로 입력합니다. 이는 df.A와 동일합니다.

index=false로 하면 세로 0,1,2, 목차가 없어짐

header=false는 위에 칼럼명 없어짐

index=True, header=True 는 디폴트값.

na_rep='-' 빈칸은 -로 표시됨

df.to_csv('friends.csv', index=True, header=True, na_rep='-')

df[a:b] 인덱스 a부터 b-1까지

df.loc[a.c] 인덱스 a부터 c까지

df_filtered=df[df.age>25]

df_filtered=df.query('조건 ')

list로 할땐 df=pd.DataFrame.from_records(friend_list)

행은 모든행, 칼럼은 0부터 1까지만

df_filtered=df[[' ',' ']]

df.filter(items=['', ''])

칼럼명에 a가 들어간것

칼럼명이 b로 끝나는 것 axis= 축

regex ->정규표현식 : 특정한 규칙을 가진 문자열의 집합을 표현하는 데 사용하는 형식 언어이다.

'2021-2학기 > 데이터분석' 카테고리의 다른 글

크롤링  (0) 2022.03.23
영화리뷰 감정분석  (0) 2022.03.23
서울종합병원분포 알아보기  (0) 2022.03.23
Pandas 3주차  (0) 2022.03.23
딕셔너리, 아이템  (0) 2022.03.23
Comments