13 лет назад · fa47f2368a
--- a/.gitignore
+++ b/.gitignore
@@ -2,3 +2,4 @@
 
				 *.*DS_Store
			
 
				 .*.sw*
			
 
				 .ropeproject
			
 
				+oauth.json
			
--- a/fabfile.py
+++ b/fabfile.py
@@ -2,12 +2,21 @@
 
				 
			
 
				 from __future__ import print_function
			
 
				 
			
 
				-
			
 
				 ##### Configuration ##############################
			
 
				 
			
 
				+import codecs
			
 
				+import os
			
 
				 import json
			
 
				 
			
 
				-CONFIG = json.load(open('config.json'))
			
 
				+os.environ["PYTHONIOENCODING"] = "utf-8"
			
 
				+
			
 
				+CONFIG_FILE = "config.json"
			
 
				+CONFIG = json.load(codecs.open(CONFIG_FILE, "r", "utf-8"))
			
 
				+
			
 
				+OAUTH_CONFIG_FILE = "oauth.json"
			
 
				+OAUTH_CONFIG = None
			
 
				+if os.path.exists(OAUTH_CONFIG_FILE):
			
 
				+    OAUTH_CONFIG = json.load(codecs.open(OAUTH_CONFIG_FILE, "r", "utf-8"))
			
 
				 
			
 
				 ## NOTES
			
 
				 ## 1. This assumes that you have already created the S3 bucket whose name
			
@@ -20,66 +29,59 @@ CONFIG = json.load(open('config.json'))
 
				 
			
 
				 ##### Imports ####################################
			
 
				 
			
 
				-
			
 
				-import os
			
 
				 import datetime
			
 
				 import subprocess
			
 
				 import copy
			
 
				-from xmlrpclib import ServerProxy
			
 
				+import webbrowser
			
 
				+import urllib
			
 
				 
			
 
				 import boto
			
 
				 import boto.s3.bucket
			
 
				 import boto.s3.key
			
 
				 from bs4 import BeautifulSoup
			
 
				+import requests
			
 
				 
			
 
				 from fabric.api import task, local
			
 
				+from fabric.utils import abort
			
 
				 
			
 
				 
			
 
				 ##### Start with checks ##########################
			
 
				 
			
 
				 
			
 
				-for chapter in CONFIG['MARKDOWN_FILES']:
			
 
				-    assert (chapter['slug'].lower() == chapter['slug']), \
			
 
				-        "Slug must be lower case : {}".format(chapter['slug'])
			
 
				+for chapter in CONFIG["MARKDOWN_FILES"]:
			
 
				+    assert (chapter["slug"].lower() == chapter["slug"]), \
			
 
				+        "Slug must be lower case : {}".format(chapter["slug"])
			
 
				 
			
 
				-if str(os.environ.get('AWS_ENABLED')).lower() == 'false':
			
 
				+if str(os.environ.get("AWS_ENABLED")).lower() == "false":
			
 
				     AWS_ENABLED = False
			
 
				-elif os.environ.get('AWS_ACCESS_KEY_ID') is not None \
			
 
				-        and len(os.environ['AWS_ACCESS_KEY_ID']) > 0 \
			
 
				-        and os.environ.get('AWS_SECRET_ACCESS_KEY') is not None \
			
 
				-        and len(os.environ['AWS_SECRET_ACCESS_KEY']) > 0 \
			
 
				-        and os.environ.get('AWS_S3_BUCKET_NAME') is not None \
			
 
				-        and len(os.environ['AWS_S3_BUCKET_NAME']) > 0:
			
 
				+elif os.environ.get("AWS_ACCESS_KEY_ID") is not None \
			
 
				+        and len(os.environ["AWS_ACCESS_KEY_ID"]) > 0 \
			
 
				+        and os.environ.get("AWS_SECRET_ACCESS_KEY") is not None \
			
 
				+        and len(os.environ["AWS_SECRET_ACCESS_KEY"]) > 0 \
			
 
				+        and os.environ.get("AWS_S3_BUCKET_NAME") is not None \
			
 
				+        and len(os.environ["AWS_S3_BUCKET_NAME"]) > 0:
			
 
				     AWS_ENABLED = True
			
 
				 else:
			
 
				     AWS_ENABLED = False
			
 
				     print("NOTE: S3 uploading is disabled because of missing " +
			
 
				           "AWS key environment variables.")
			
 
				 
			
 
				-# In my case, they are the same - 'files.swaroopch.com'
			
 
				+# In my case, they are the same - "files.swaroopch.com"
			
 
				 # http://docs.amazonwebservices.com/AmazonS3/latest/dev/VirtualHosting.html#VirtualHostingCustomURLs
			
 
				 if AWS_ENABLED:
			
 
				-    S3_PUBLIC_URL = os.environ['AWS_S3_BUCKET_NAME']
			
 
				+    S3_PUBLIC_URL = os.environ["AWS_S3_BUCKET_NAME"]
			
 
				     #else
			
 
				-    #S3_PUBLIC_URL = 's3.amazonaws.com/{}'.format(
			
 
				-        #os.environ['AWS_S3_BUCKET_NAME'])
			
 
				-
			
 
				-
			
 
				-if os.environ.get('WORDPRESS_RPC_URL') is not None \
			
 
				-        and len(os.environ['WORDPRESS_RPC_URL']) > 0 \
			
 
				-        and os.environ.get('WORDPRESS_BASE_URL') is not None \
			
 
				-        and len(os.environ['WORDPRESS_BASE_URL']) > 0 \
			
 
				-        and os.environ.get('WORDPRESS_BLOG_ID') is not None \
			
 
				-        and len(os.environ['WORDPRESS_BLOG_ID']) > 0 \
			
 
				-        and os.environ.get('WORDPRESS_USERNAME') is not None \
			
 
				-        and len(os.environ['WORDPRESS_USERNAME']) > 0 \
			
 
				-        and os.environ.get('WORDPRESS_PASSWORD') is not None \
			
 
				-        and len(os.environ['WORDPRESS_PASSWORD']) > 0 \
			
 
				-        and os.environ.get('WORDPRESS_PARENT_PAGE_ID') is not None \
			
 
				-        and len(os.environ['WORDPRESS_PARENT_PAGE_ID']) > 0 \
			
 
				-        and os.environ.get('WORDPRESS_PARENT_PAGE_SLUG') is not None \
			
 
				-        and len(os.environ['WORDPRESS_PARENT_PAGE_SLUG']) > 0:
			
 
				+    #S3_PUBLIC_URL = "s3.amazonaws.com/{}".format(
			
 
				+        #os.environ["AWS_S3_BUCKET_NAME"])
			
 
				+
			
 
				+
			
 
				+if OAUTH_CONFIG is not None:
			
 
				     WORDPRESS_ENABLED = True
			
 
				+    WORDPRESS_CLIENT_ID = os.environ["WORDPRESS_CLIENT_ID"]
			
 
				+    WORDPRESS_CLIENT_SECRET = os.environ["WORDPRESS_CLIENT_SECRET"]
			
 
				+    WORDPRESS_PARENT_PAGE_ID = int(os.environ["WORDPRESS_PARENT_PAGE_ID"])
			
 
				+    WORDPRESS_PARENT_PAGE_SLUG = os.environ["WORDPRESS_PARENT_PAGE_SLUG"]
			
 
				+    WORDPRESS_BASE_URL = os.environ["WORDPRESS_BASE_URL"]
			
 
				 else:
			
 
				     WORDPRESS_ENABLED = False
			
 
				     print("NOTE: Wordpress uploading is disabled because of " +
			
@@ -88,51 +90,52 @@ else:
 
				 
			
 
				 ##### Helper methods #############################
			
 
				 
			
 
				-
			
 
				 def _upload_to_s3(filename, key):
			
 
				     """http://docs.pythonboto.org/en/latest/s3_tut.html#storing-data"""
			
 
				     conn = boto.connect_s3()
			
 
				-    b = boto.s3.bucket.Bucket(conn, os.environ['AWS_S3_BUCKET_NAME'])
			
 
				+    b = boto.s3.bucket.Bucket(conn, os.environ["AWS_S3_BUCKET_NAME"])
			
 
				     k = boto.s3.key.Key(b)
			
 
				     k.key = key
			
 
				     k.set_contents_from_filename(filename)
			
 
				-    k.set_acl('public-read')
			
 
				+    k.set_acl("public-read")
			
 
				 
			
 
				-    url = 'http://{}/{}'.format(S3_PUBLIC_URL, key)
			
 
				+    url = "http://{}/{}".format(S3_PUBLIC_URL, key)
			
 
				     print("Uploaded to S3 : {}".format(url))
			
 
				     return url
			
 
				 
			
 
				 
			
 
				 def upload_output_to_s3(filename):
			
 
				-    key = "{}/{}".format(CONFIG['SHORT_PROJECT_NAME'],
			
 
				-                         filename.split('/')[-1])
			
 
				+    key = "{}/{}".format(CONFIG["SHORT_PROJECT_NAME"],
			
 
				+                         filename.split("/")[-1])
			
 
				     return _upload_to_s3(filename, key)
			
 
				 
			
 
				 
			
 
				 def upload_asset_to_s3(filename):
			
 
				-    key = "{}/assets/{}".format(CONFIG['SHORT_PROJECT_NAME'],
			
 
				-                                filename.split('/')[-1])
			
 
				+    key = "{}/assets/{}".format(CONFIG["SHORT_PROJECT_NAME"],
			
 
				+                                filename.split("/")[-1])
			
 
				     return _upload_to_s3(filename, key)
			
 
				 
			
 
				 
			
 
				 def replace_images_with_s3_urls(text):
			
 
				     """http://www.crummy.com/software/BeautifulSoup/bs4/doc/"""
			
 
				     soup = BeautifulSoup(text)
			
 
				-    for image in soup.find_all('img'):
			
 
				-        image['src'] = upload_asset_to_s3(image['src'])
			
 
				-    return unicode(soup)
			
 
				+    for image in soup.find_all("img"):
			
 
				+        image["src"] = upload_asset_to_s3(image["src"])
			
 
				+    return str(soup)
			
 
				 
			
 
				 
			
 
				 def markdown_to_html(source_text, upload_assets_to_s3=False):
			
 
				     """Convert from Markdown to HTML; optional: upload images, etc. to S3."""
			
 
				-    args = ['pandoc',
			
 
				-            '-f', 'markdown',
			
 
				-            '-t', 'html5']
			
 
				+    args = ["pandoc",
			
 
				+            "-f", "markdown",
			
 
				+            "-t", "html5"]
			
 
				     p = subprocess.Popen(args, stdin=subprocess.PIPE, stdout=subprocess.PIPE)
			
 
				-    output = p.communicate(source_text)[0]
			
 
				+    output = p.communicate(source_text.encode("utf-8", "ignore"))[0]
			
 
				 
			
 
				     # http://wordpress.org/extend/plugins/raw-html/
			
 
				-    output = '<!--raw-->\n' + output + '\n<!--/raw-->'
			
 
				+    output = u"<!--raw-->\n" + \
			
 
				+             output.decode("utf-8", "ignore") + \
			
 
				+             u"\n<!--/raw-->"
			
 
				 
			
 
				     # NOTE: Also assumes that you have added the CSS from
			
 
				     # `pandoc -S -t html5` to the `style.css` of your active Wordpress theme.
			
@@ -140,109 +143,55 @@ def markdown_to_html(source_text, upload_assets_to_s3=False):
 
				     if upload_assets_to_s3:
			
 
				         output = replace_images_with_s3_urls(output)
			
 
				 
			
 
				-    return output
			
 
				-
			
 
				-
			
 
				-def _wordpress_get_pages():
			
 
				-    server = ServerProxy(os.environ['WORDPRESS_RPC_URL'])
			
 
				-    print("Fetching list of pages from WordPress")
			
 
				-    return server.wp.getPosts(os.environ['WORDPRESS_BLOG_ID'],
			
 
				-                              os.environ['WORDPRESS_USERNAME'],
			
 
				-                              os.environ['WORDPRESS_PASSWORD'],
			
 
				-                              {
			
 
				-                                  'post_type': 'page',
			
 
				-                                  'number': pow(10, 5),
			
 
				-                              })
			
 
				-
			
 
				-
			
 
				-def wordpress_new_page(slug, title, content):
			
 
				-    """Create a new Wordpress page.
			
 
				-
			
 
				-https://codex.wordpress.org/XML-RPC_WordPress_API/Posts#wp.newPost
			
 
				-https://codex.wordpress.org/Function_Reference/wp_insert_post
			
 
				-http://docs.python.org/library/xmlrpclib.html
			
 
				-"""
			
 
				-    server = ServerProxy(os.environ['WORDPRESS_RPC_URL'])
			
 
				-    return server.wp.newPost(os.environ['WORDPRESS_BLOG_ID'],
			
 
				-                             os.environ['WORDPRESS_USERNAME'],
			
 
				-                             os.environ['WORDPRESS_PASSWORD'],
			
 
				-                             {
			
 
				-                                 'post_name': slug,
			
 
				-                                 'post_content': content,
			
 
				-                                 'post_title': title,
			
 
				-                                 'post_parent':
			
 
				-                                 os.environ['WORDPRESS_PARENT_PAGE_ID'],
			
 
				-                                 'post_type': 'page',
			
 
				-                                 'post_status': 'publish',
			
 
				-                                 'comment_status': 'closed',
			
 
				-                                 'ping_status': 'closed',
			
 
				-                             })
			
 
				-
			
 
				-
			
 
				-def wordpress_edit_page(post_id, title, content):
			
 
				-    """Edit a Wordpress page.
			
 
				-
			
 
				-https://codex.wordpress.org/XML-RPC_WordPress_API/Posts#wp.editPost
			
 
				-https://codex.wordpress.org/Function_Reference/wp_insert_post
			
 
				-http://docs.python.org/library/xmlrpclib.html
			
 
				-"""
			
 
				-    server = ServerProxy(os.environ['WORDPRESS_RPC_URL'])
			
 
				-    return server.wp.editPost(os.environ['WORDPRESS_BLOG_ID'],
			
 
				-                              os.environ['WORDPRESS_USERNAME'],
			
 
				-                              os.environ['WORDPRESS_PASSWORD'],
			
 
				-                              post_id,
			
 
				-                              {
			
 
				-                                  'post_content': content,
			
 
				-                                  'post_title': title,
			
 
				-                              })
			
 
				+    return output.decode("utf-8", "ignore")
			
 
				 
			
 
				 
			
 
				 def collect_header_anchors(chapter, i, all_headers):
			
 
				-    soup = BeautifulSoup(chapter['html'])
			
 
				-    for header in soup.find_all(['h1', 'h2', 'h3', 'h4', 'h5', 'h6']):
			
 
				-        if 'id' in header.attrs:
			
 
				-            all_headers[header['id']] = i
			
 
				+    soup = BeautifulSoup(chapter["html"])
			
 
				+    for header in soup.find_all(["h1", "h2", "h3", "h4", "h5", "h6"]):
			
 
				+        if "id" in header.attrs:
			
 
				+            all_headers[header["id"]] = i
			
 
				 
			
 
				 
			
 
				 def fix_links_to_other_chapters(chapter, chapters, all_headers):
			
 
				     """Fix links to other sections with Wordpress page URL."""
			
 
				-    soup = BeautifulSoup(chapter['html'])
			
 
				-    for link in soup.find_all('a'):
			
 
				-        if 'href' in link.attrs:
			
 
				-            if link['href'].startswith('#'):
			
 
				-                header_id = link['href'][1:]
			
 
				+    soup = BeautifulSoup(chapter["html"])
			
 
				+    for link in soup.find_all("a"):
			
 
				+        if "href" in link.attrs:
			
 
				+            if link["href"].startswith("#"):
			
 
				+                header_id = link["href"][1:]
			
 
				                 assert header_id in all_headers, \
			
 
				                     "#{} does not exist, referred in {}".format(
			
 
				-                    header_id, chapter['file'])
			
 
				+                    header_id, chapter["file"])
			
 
				                 other_chapter = chapters[all_headers[header_id]]
			
 
				-                link['href'] = '{}#{}'.format(
			
 
				-                    other_chapter['link'],
			
 
				+                link["href"] = "{}#{}".format(
			
 
				+                    other_chapter["link"],
			
 
				                     header_id)
			
 
				-    chapter['html'] = unicode(soup)
			
 
				+    chapter["html"] = unicode(soup)
			
 
				 
			
 
				 
			
 
				 def add_previous_next_links(chapter, i, chapters):
			
 
				     previous_link = None
			
 
				     if i > 0:
			
 
				-        previous_link = chapters[i - 1]['link']
			
 
				+        previous_link = chapters[i - 1]["link"]
			
 
				 
			
 
				     next_link = None
			
 
				     if i < len(chapters) - 1:
			
 
				-        next_link = chapters[i + 1]['link']
			
 
				+        next_link = chapters[i + 1]["link"]
			
 
				 
			
 
				     if previous_link is not None or next_link is not None:
			
 
				-        chapter['html'] += "\n"
			
 
				+        chapter["html"] += u"\n"
			
 
				 
			
 
				     if previous_link is not None:
			
 
				-        chapter['html'] += """\
			
 
				+        chapter["html"] += u"""\
			
 
				 <a href="{}">&lArr; Previous chapter</a>\
			
 
				 """.format(previous_link)
			
 
				 
			
 
				     if previous_link is not None and next_link is not None:
			
 
				-        chapter['html'] += '&nbsp;' * 5
			
 
				+        chapter["html"] += u"&nbsp;" * 5
			
 
				 
			
 
				     if next_link is not None:
			
 
				-        chapter['html'] += """\
			
 
				+        chapter["html"] += u"""\
			
 
				 <a href="{}">Next chapter &rArr;</a>\
			
 
				 """.format(next_link)
			
 
				 
			
@@ -252,24 +201,157 @@ def add_previous_next_links(chapter, i, chapters):
 
				 
			
 
				 @task
			
 
				 def prepare():
			
 
				-    frontpage = CONFIG['MARKDOWN_FILES'][0]
			
 
				-    content = open(frontpage['file']).read()
			
 
				+    frontpage = CONFIG["MARKDOWN_FILES"][0]
			
 
				+    content = codecs.open(frontpage["file"], "r", "utf-8").read()
			
 
				     # TODO Can I make this always go change the third line instead?
			
 
				     # TODO And then go back and change it to "$$date$$" so that it
			
 
				     # is not inadvertently committed to the git repo.
			
 
				-    content = content.replace("$$date$$",
			
 
				-                              datetime.datetime.now().strftime("%d %b %Y"))
			
 
				-    with open(frontpage['file'], 'w') as output:
			
 
				+    today = unicode(datetime.datetime.now().strftime("%d %b %Y"))
			
 
				+    content = content.replace(u"$$date$$", today)
			
 
				+    with codecs.open(frontpage["file"], "w", "utf-8") as output:
			
 
				         output.write(content)
			
 
				 
			
 
				 
			
 
				 @task
			
 
				+def html():
			
 
				+    """HTML5 output."""
			
 
				+    prepare()
			
 
				+
			
 
				+    args = ["pandoc",
			
 
				+            "-f", "markdown",
			
 
				+            "-t", "html5",
			
 
				+            "-o", "{}.html".format(CONFIG["FULL_PROJECT_NAME"]),
			
 
				+            "-s",
			
 
				+            "--toc"] + [i["file"] for i in CONFIG["MARKDOWN_FILES"]]
			
 
				+    local(" ".join(args))
			
 
				+    local("open {}.html".format(CONFIG["FULL_PROJECT_NAME"]))
			
 
				+
			
 
				+
			
 
				+@task
			
 
				+def epub():
			
 
				+    """http://johnmacfarlane.net/pandoc/epub.html"""
			
 
				+    prepare()
			
 
				+
			
 
				+    args = ["pandoc",
			
 
				+            "-f", "markdown",
			
 
				+            "-t", "epub",
			
 
				+            "-o", "{}.epub".format(CONFIG["FULL_PROJECT_NAME"])] + \
			
 
				+        [i["file"] for i in CONFIG["MARKDOWN_FILES"]]
			
 
				+    # TODO --epub-cover-image
			
 
				+    # TODO --epub-metadata
			
 
				+    # TODO --epub-stylesheet
			
 
				+    local(" ".join(args))
			
 
				+    if AWS_ENABLED:
			
 
				+        upload_output_to_s3("{}.epub".format(CONFIG["FULL_PROJECT_NAME"]))
			
 
				+
			
 
				+
			
 
				+@task
			
 
				+def pdf():
			
 
				+    """http://johnmacfarlane.net/pandoc/README.html#creating-a-pdf"""
			
 
				+    prepare()
			
 
				+
			
 
				+    args = ["pandoc",
			
 
				+            "-f", "markdown",
			
 
				+            # https://github.com/jgm/pandoc/issues/571
			
 
				+            #"-t", "pdf",
			
 
				+            "-o", "{}.pdf".format(CONFIG["FULL_PROJECT_NAME"]),
			
 
				+            "-N",
			
 
				+            # https://github.com/jgm/pandoc/issues/600
			
 
				+            "-V", "papersize:\"a4paper\"",
			
 
				+            "--toc"] + [i["file"] for i in CONFIG["MARKDOWN_FILES"]]
			
 
				+    local(" ".join(args))
			
 
				+    if AWS_ENABLED:
			
 
				+        upload_output_to_s3("{}.pdf".format(CONFIG["FULL_PROJECT_NAME"]))
			
 
				+
			
 
				+
			
 
				+@task
			
 
				+def clean():
			
 
				+    """Remove generated output files"""
			
 
				+    possible_outputs = (
			
 
				+        "{}.html".format(CONFIG["FULL_PROJECT_NAME"]),
			
 
				+        "{}.epub".format(CONFIG["FULL_PROJECT_NAME"]),
			
 
				+        "{}.pdf".format(CONFIG["FULL_PROJECT_NAME"]),
			
 
				+    )
			
 
				+
			
 
				+    for filename in possible_outputs:
			
 
				+        if os.path.exists(filename):
			
 
				+            os.remove(filename)
			
 
				+            print("Removed {}".format(filename))
			
 
				+
			
 
				+
			
 
				+@task
			
 
				+def push():
			
 
				+    """Upload Wordpress, EPUB, PDF."""
			
 
				+    clean()
			
 
				+    wp()
			
 
				+    epub()
			
 
				+    pdf()
			
 
				+
			
 
				+
			
 
				+########## WordPress ##########
			
 
				+
			
 
				+
			
 
				+@task
			
 
				+def oauth_step1():
			
 
				+    """Fetch OAuth2 token.
			
 
				+
			
 
				+    http://developer.wordpress.com/docs/oauth2/"""
			
 
				+    if os.path.exists(OAUTH_CONFIG_FILE):
			
 
				+        os.remove(OAUTH_CONFIG_FILE)
			
 
				+
			
 
				+    request_url = "https://public-api.wordpress.com/oauth2/authorize"
			
 
				+    params = {
			
 
				+        "client_id": WORDPRESS_CLIENT_ID,
			
 
				+        "redirect_uri": "http://swaroopch.com",
			
 
				+        "response_type": "code",
			
 
				+    }
			
 
				+    url = "{}?{}".format(request_url, urllib.urlencode(params))
			
 
				+    print("""\
			
 
				+1. After authorization, it will redirect, for e.g.
			
 
				+   http://swaroopch.com/?code=8D1Gq1tLQy&state
			
 
				+2. Extract the code from the URL and run:
			
 
				+   fab oauth_step2:8D1Gq1tLQy
			
 
				+3. See generated OAUTH_CONFIG_FILE file
			
 
				+""")
			
 
				+    try:
			
 
				+        proceed = raw_input("Proceed? (y/n) ")
			
 
				+        if proceed.lower().startswith("y"):
			
 
				+            webbrowser.open(url)
			
 
				+        else:
			
 
				+            abort("Okay, bye.")
			
 
				+    except SyntaxError:
			
 
				+        abort("Okay, bye.")
			
 
				+
			
 
				+
			
 
				+@task
			
 
				+def oauth_step2(code):
			
 
				+    """Use fetched token to generate OAuth access token."""
			
 
				+    request_url = "https://public-api.wordpress.com/oauth2/token"
			
 
				+    params = {
			
 
				+        "client_id": WORDPRESS_CLIENT_ID,
			
 
				+        "client_secret": WORDPRESS_CLIENT_SECRET,
			
 
				+        "code": code,
			
 
				+        "redirect_uri": "http://swaroopch.com",
			
 
				+        "grant_type": "authorization_code",
			
 
				+    }
			
 
				+
			
 
				+    response = requests.post(request_url, data=params)
			
 
				+    response.raise_for_status()
			
 
				+    response = response.json()
			
 
				+
			
 
				+    print(response)
			
 
				+
			
 
				+    with codecs.open(OAUTH_CONFIG_FILE, "w", "utf-8") as output_file:
			
 
				+        json.dump(response, output_file, sort_keys=True, indent=2)
			
 
				+
			
 
				+
			
 
				+@task
			
 
				 def wp():
			
 
				-    """https://codex.wordpress.org/XML-RPC_WordPress_API/Posts"""
			
 
				+    """http://developer.wordpress.com/docs/api/"""
			
 
				     if WORDPRESS_ENABLED:
			
 
				         prepare()
			
 
				 
			
 
				-        chapters = copy.deepcopy(CONFIG['MARKDOWN_FILES'])
			
 
				+        chapters = copy.deepcopy(CONFIG["MARKDOWN_FILES"])
			
 
				 
			
 
				         # header anchor id -> index in MARKDOWN_FILES
			
 
				         all_headers = {}
			
@@ -277,15 +359,17 @@ def wp():
 
				         # Render html
			
 
				         print("Rendering html")
			
 
				         for (i, chapter) in enumerate(chapters):
			
 
				-            chapter['html'] = markdown_to_html(open(chapter['file']).read(),
			
 
				-                                               upload_assets_to_s3=AWS_ENABLED)
			
 
				+            chapter_content = codecs.open(chapter["file"], "r", "utf-8").read()
			
 
				+            chapter["html"] = markdown_to_html(
			
 
				+                chapter_content,
			
 
				+                upload_assets_to_s3=AWS_ENABLED)
			
 
				 
			
 
				             collect_header_anchors(chapter, i, all_headers)
			
 
				 
			
 
				-            chapter['link'] = "{}/{}/{}".format(
			
 
				-                os.environ['WORDPRESS_BASE_URL'],
			
 
				-                os.environ['WORDPRESS_PARENT_PAGE_SLUG'],
			
 
				-                chapter['slug'])
			
 
				+            chapter["link"] = "{}/{}/{}".format(
			
 
				+                WORDPRESS_BASE_URL,
			
 
				+                WORDPRESS_PARENT_PAGE_SLUG,
			
 
				+                chapter["slug"])
			
 
				 
			
 
				         # Fix cross-links
			
 
				         for chapter in chapters:
			
@@ -297,101 +381,93 @@ def wp():
 
				 
			
 
				         # Fetch list of pages on the server and determine which already exist
			
 
				         existing_pages = _wordpress_get_pages()
			
 
				-        existing_page_slugs = [i.get('post_name') for i in existing_pages]
			
 
				-
			
 
				-        def page_slug_to_id(slug):
			
 
				-            pages = [i for i in existing_pages if i.get('post_name') == slug]
			
 
				-            page = pages[0]
			
 
				-            return page['post_id']
			
 
				+        page_slug_to_id = dict([(i.get("slug"), i.get("ID"))
			
 
				+                                for i in existing_pages])
			
 
				 
			
 
				         for chapter in chapters:
			
 
				-            if chapter['slug'] in existing_page_slugs:
			
 
				-                chapter['page_id'] = page_slug_to_id(chapter['slug'])
			
 
				+            if chapter["slug"] in page_slug_to_id:
			
 
				+                chapter["page_id"] = page_slug_to_id[chapter["slug"]]
			
 
				 
			
 
				         # Send to WP
			
 
				         print("Uploading to WordPress")
			
 
				         for chapter in chapters:
			
 
				-            if chapter['slug'] in existing_page_slugs:
			
 
				-                print("Existing page: {}".format(chapter['link']))
			
 
				-                assert wordpress_edit_page(chapter['page_id'],
			
 
				-                                           chapter['title'],
			
 
				-                                           chapter['html'])
			
 
				+            if chapter["slug"] in page_slug_to_id:
			
 
				+                print("Existing page: {}".format(chapter["link"]))
			
 
				+                assert wordpress_edit_page(chapter["page_id"],
			
 
				+                                           chapter["title"],
			
 
				+                                           chapter["html"])
			
 
				             else:
			
 
				-                print("New page: {}".format(chapter['link']))
			
 
				-                assert wordpress_new_page(chapter['slug'],
			
 
				-                                          chapter['title'],
			
 
				-                                          chapter['html'])
			
 
				+                print("New page: {}".format(chapter["link"]))
			
 
				+                assert wordpress_new_page(chapter["slug"],
			
 
				+                                          chapter["title"],
			
 
				+                                          chapter["html"])
			
 
				 
			
 
				 
			
 
				-@task
			
 
				-def html():
			
 
				-    """HTML5 output."""
			
 
				-    prepare()
			
 
				+def _wordpress_headers():
			
 
				+    assert WORDPRESS_ENABLED
			
 
				 
			
 
				-    args = ['pandoc',
			
 
				-            '-f', 'markdown',
			
 
				-            '-t', 'html5',
			
 
				-            '-o', '{}.html'.format(CONFIG['FULL_PROJECT_NAME']),
			
 
				-            '-s',
			
 
				-            '--toc'] + [i['file'] for i in CONFIG['MARKDOWN_FILES']]
			
 
				-    local(' '.join(args))
			
 
				-    local('open {}.html'.format(CONFIG['FULL_PROJECT_NAME']))
			
 
				+    return {
			
 
				+        "Authorization": "Bearer {}".format(OAUTH_CONFIG["access_token"]),
			
 
				+    }
			
 
				 
			
 
				 
			
 
				-@task
			
 
				-def epub():
			
 
				-    """http://johnmacfarlane.net/pandoc/epub.html"""
			
 
				-    prepare()
			
 
				-
			
 
				-    args = ['pandoc',
			
 
				-            '-f', 'markdown',
			
 
				-            '-t', 'epub',
			
 
				-            '-o', '{}.epub'.format(CONFIG['FULL_PROJECT_NAME'])] + \
			
 
				-        [i['file'] for i in CONFIG['MARKDOWN_FILES']]
			
 
				-    # TODO --epub-cover-image
			
 
				-    # TODO --epub-metadata
			
 
				-    # TODO --epub-stylesheet
			
 
				-    local(' '.join(args))
			
 
				-    if AWS_ENABLED:
			
 
				-        upload_output_to_s3('{}.epub'.format(CONFIG['FULL_PROJECT_NAME']))
			
 
				-
			
 
				-
			
 
				-@task
			
 
				-def pdf():
			
 
				-    """http://johnmacfarlane.net/pandoc/README.html#creating-a-pdf"""
			
 
				-    prepare()
			
 
				-
			
 
				-    args = ['pandoc',
			
 
				-            '-f', 'markdown',
			
 
				-            # https://github.com/jgm/pandoc/issues/571
			
 
				-            #'-t', 'pdf',
			
 
				-            '-o', '{}.pdf'.format(CONFIG['FULL_PROJECT_NAME']),
			
 
				-            '-N',
			
 
				-            # https://github.com/jgm/pandoc/issues/600
			
 
				-            '-V', 'papersize:"a4paper"',
			
 
				-            '--toc'] + [i['file'] for i in CONFIG['MARKDOWN_FILES']]
			
 
				-    local(' '.join(args))
			
 
				-    if AWS_ENABLED:
			
 
				-        upload_output_to_s3('{}.pdf'.format(CONFIG['FULL_PROJECT_NAME']))
			
 
				+def _wordpress_get_pages():
			
 
				+    url = "https://public-api.wordpress.com/rest/v1/sites/{}/posts/"
			
 
				+    url = url.format(OAUTH_CONFIG["blog_id"])
			
 
				+
			
 
				+    offset = 0
			
 
				+    number = 100
			
 
				+    posts = []
			
 
				+
			
 
				+    while True:
			
 
				+        print("offset = {}".format(offset))
			
 
				+        response = requests.get(url,
			
 
				+                                params={"context": "edit",
			
 
				+                                        "type": "page",
			
 
				+                                        "status": "publish",
			
 
				+                                        "number": number,
			
 
				+                                        "offset": offset},
			
 
				+                                        # TODO "tag": CONFIG["FULL_PROJECT_NAME"]
			
 
				+                                headers=_wordpress_headers())
			
 
				+        response.raise_for_status()
			
 
				+        new_posts = response.json()["posts"]
			
 
				+        posts.extend(new_posts)
			
 
				+        if len(new_posts) < number:
			
 
				+            break
			
 
				+        offset += 100
			
 
				+
			
 
				+    return posts
			
 
				 
			
 
				 
			
 
				-@task
			
 
				-def push():
			
 
				-    wp()
			
 
				-    epub()
			
 
				-    pdf()
			
 
				-
			
 
				+def wordpress_new_page(slug, title, content):
			
 
				+    """Create a new Wordpress page."""
			
 
				+    url = "https://public-api.wordpress.com/rest/v1/sites/{}/posts/new"
			
 
				+    url = url.format(OAUTH_CONFIG["blog_id"])
			
 
				+
			
 
				+    response = requests.post(url,
			
 
				+                             data={"slug": slug,
			
 
				+                                   "title": title,
			
 
				+                                   "content": content,
			
 
				+                                   "parent": WORDPRESS_PARENT_PAGE_ID,
			
 
				+                                   "type": "page",
			
 
				+                                   "tags": [CONFIG["FULL_PROJECT_NAME"]],
			
 
				+                                   "comments_open": False,
			
 
				+                                   "pings_open": False,
			
 
				+                                   "publicize": False},
			
 
				+                             headers=_wordpress_headers())
			
 
				+    response.raise_for_status()
			
 
				+    return response.json()
			
 
				 
			
 
				-@task
			
 
				-def clean():
			
 
				-    """Remove generated output files"""
			
 
				-    possible_outputs = (
			
 
				-        '{}.html'.format(CONFIG['FULL_PROJECT_NAME']),
			
 
				-        '{}.epub'.format(CONFIG['FULL_PROJECT_NAME']),
			
 
				-        '{}.pdf'.format(CONFIG['FULL_PROJECT_NAME']),
			
 
				-    )
			
 
				 
			
 
				-    for filename in possible_outputs:
			
 
				-        if os.path.exists(filename):
			
 
				-            os.remove(filename)
			
 
				-            print("Removed {}".format(filename))
			
 
				+def wordpress_edit_page(post_id, title, content):
			
 
				+    """Edit a Wordpress page."""
			
 
				+    url = "https://public-api.wordpress.com/rest/v1/sites/{}/posts/{}"
			
 
				+    url = url.format(OAUTH_CONFIG["blog_id"], post_id)
			
 
				+
			
 
				+    response = requests.post(url,
			
 
				+                             data={"title": title,
			
 
				+                                   "content": content,
			
 
				+                                   "tags": [CONFIG["FULL_PROJECT_NAME"]]},
			
 
				+                             headers=_wordpress_headers())
			
 
				+    response.raise_for_status()
			
 
				+    return response.json()
			
--- a/requirements.txt
+++ b/requirements.txt
@@ -1,3 +1,4 @@
 
				 Fabric == 1.7.0
			
 
				 boto == 2.9.9
			
 
				 beautifulsoup4 == 4.2.1
			
 
				+requests == 1.2.3