') # Convert solo returns to
comments = comments.replace(u'\n', '
') # Convert two hyphens to emdash comments = comments.replace('--', '—') soup = html5_parser('

') container = result.find('div') rtc = 0 open_pTag = False all_tokens = list(soup.contents) inline_tags = ('br', 'b', 'i', 'em', 'strong', 'span', 'font', 'a', 'hr') for token in all_tokens: if isinstance(token, (bs4.CData, bs4.Comment, bs4.Declaration, bs4.ProcessingInstruction)): continue if isinstance(token, bs4.NavigableString): if not open_pTag: pTag = result.new_tag('p') open_pTag = True ptc = 0 pTag.insert(ptc, token) ptc += 1 elif token.name in inline_tags: if not open_pTag: pTag = result.new_tag('p') open_pTag = True ptc = 0 pTag.insert(ptc, token) ptc += 1 else: if open_pTag: container.insert(rtc, pTag) rtc += 1 open_pTag = False ptc = 0 container.insert(rtc, token) rtc += 1 if open_pTag: container.insert(rtc, pTag) for p in container.findAll('p'): p['class'] = 'description' return container.decode_contents() def markdown(val): try: md = markdown.Markdown except AttributeError: from ebook_converter.ebooks.markdown import Markdown md = markdown.Markdown = Markdown() return md.convert(val) def merge_comments(one, two): return comments_to_html(one) + '\n\n' + comments_to_html(two) def sanitize_comments_html(html): from ebook_converter.ebooks.markdown import Markdown text = html2text(html) md = Markdown() html = md.convert(text) return html def find_tests(): import unittest class Test(unittest.TestCase): def test_comments_to_html(self): for pat, val in [ (b'lineone\n\nlinetwo', '

lineone

linetwo

'), ('a b&c\nf', '

a b&c
f

'), ('a b\n\ncd', '

a b

'), ]: cval = comments_to_html(pat) self.assertEqual(cval, val) return unittest.defaultTestLoader.loadTestsFromTestCase(Test)