소스 검색

Adding EDA tutorial

Marc Garcia 6 년 전
부모
커밋
eb104453c2
2개의 변경된 파일174개의 추가작업 그리고 0개의 파일을 삭제
  1. 157 0
      05_Page_views_eda.ipynb
  2. 17 0
      solutions/page_view_eda.py

파일 크기가 너무 크기때문에 변경 상태를 표시하지 않습니다.
+ 157 - 0
05_Page_views_eda.ipynb


+ 17 - 0
solutions/page_view_eda.py

@@ -0,0 +1,17 @@
+import operator
+import urllib.parse
+import pandas
+
+
+page_views = pandas.read_parquet(PAGE_VIEWS_FNAME)
+page_views.index = (page_views.index
+                              .to_series()
+                              .apply(urllib.parse.urlparse)
+                              .apply(operator.attrgetter('path'))
+                              .str.split('/')
+                              .str[-1]
+                              .str.rstrip('.html'))
+
+
+docstring_errors = (pandas.read_hdf(DOCSTRING_ERRORS_FNAME)
+                          .join(page_views.groupby('Page')['Pageviews'].sum()))