전체보기39 돈으로 살 수 없는 것들 - 마이클 센델(Michael J. Sandel) 2년전쯤엔가 센델 교수님의 「정의란 무엇인가」 저서를 인상깊게 읽었다. 서점 어딜 가나 그 책이 베스트셀러 매대에서 굳건히 자리매김하고 있어서 안 볼 수가 없었다. 정의~ 책을 읽을 때에도 책에서 나오던 사례를 접하며 막연히 떠오른 생각들, 느꼈던 감정들을 그 다음 장에서 정확히 캐치해서 정의내려주는 걸 보고 소름돋았던게 한 두번이 아니었다. 그 책을 읽고 나서 책에 등장하는 수많은 철학가의 이름은 생각나지 않지만 세상에 적용되는 정의, '옳음'이란 무엇인지 큰 틀을 잡을 수 있어서 유익했다. 책 하나에 샌델 교수와 학생들의 정의에 관한 치열한 토론이 농축되어 있다는 느낌..? 그래서 「돈으로 살 수 없는 것들」도 주저하지 않고 펼쳤다. 역시 읽을 때 순간순간 드는 생각들을 예상하고 다음 장에 설명하신 .. 2022. 1. 5. 비전공자의 SQLD(SQL 개발자) 자격증 합격 후기 이 자격증에 대해 알기 전까진 sql이 뭔지도 모르고 어떤 일에 쓰이는 건지 조차 몰랐다. 근데 데이터 분석 공부를 하며 우연히 알게 되고, 따놓으면 좋겠다라는 생각에 당장 데이터자격시험 홈페이지 들어가서 응시부터 했다. 응시료 5만원에다 난 아예 노베이스 상태라 할 수 있을까 했는데 공부는 한 달 뒤의 내가 하겠지 ^^ 이러고 호기롭게 응시. 그리고 중간고사 끝나고 공부 시작했는데 진짜 개념 잡는 교재만 일주일 넘게 본 듯 하다. 사진의 A4 한뭉텅이가 개념 교재를 프린트한 건데 저 pdf 자료는 '데이터 전문가 포럼'이라는 네이버 카페에서 쉽게 다운받을 수 있다! 교재는 사면 너무 무겁고 비싸서 카페 가입하고 직접 뽑는게 이득일 것 같다. 나는 정~~말 가성비 좋게 공부하고 싶었기 때문에 개념 교재의.. 2021. 12. 21. 웹에서 YAML 파일 가져오고 dataframe 으로 나타내기 모든 데이터가 csv 형식같은 rectanglar data로 되어 있으면 데이터프레임화하기 편하지만, 데이터가 HTML, XML, JSON, YAML 등 여러 포맷의 hierachical data로 되어 있는 게 현실이다. 그래서 이런 데이터들을 파싱해서 파이썬으로 불러오고 어떻게 분석해야 하는지 정리해보겠다 ! 위 데이터셋은 미국 국회의원들의 이름, 생년월일, 소속당, 전화번호 등 자세한 정보가 들어있는 yaml 파일이다. https://github.com/unitedstates/congress-legislators/blob/main/legislators-current.yaml 깃헙에서 가져온건데, 파싱한 코드는 아래와 같다. import requests from pathlib import Path l.. 2021. 11. 4. 파이썬 pandas.melt() 데이터 재구조화(reshape) ( melt vs pivot ) 데이터 재구조화, 전처리 과정에서 pivot과 함께 melt 함수도 많이 사용된다. 하지만 pivot()과는 반대로 작동함. 간단하게 말해서 melt()는 dataframe format을 wide에서 long으로 바꿔주는 함수이다. 그래서 wide_to_long() 메서드와 함께 쓰이기도 한다. 인덱스와 열을 녹여 하나 혹은 다수의 컬럼이 identifier가 되어 dataframe을 specific format으로 재구조화한다. 원래 df의 형식이 녹여지고 식별변수(id_variable)을 기준으로 정렬된다고 생각하면 된다. 반면에 pivot()은 여러 형태로 이루어진 dataframe에 index, columns, values를 각각 지정해주어 melt된 df를 보기 좋은 형태로 재구조화 시켜주는 메.. 2021. 10. 13. 이전 1 ··· 3 4 5 6 7 8 9 10 다음