프로젝트 Projects/오픈소스 Opensources

HTML을 Markdown으로 바꿔주는 파이썬 팩키지 만들기

Tap to restart 2022. 11. 26. 21:00

HTML을 Markdown으로 바꿀 필요가 생겨서 관련 파이썬 팩키지를 찾아봤다. 찾아보니 몇개 있긴 했지만 수준이 그리 높지 않기도 했고, 간단한 거니 연습삼아 따로 하나 만들어보자는 생각으로 만들었다.


팩키지명은 htmltomd다. pypi 주소는 여기! https://pypi.org/project/htmltomd/


아래처럼 실행하면

import htmltomd

html = """
<!DOCTYPE html>
<html lang="en">
<meta charset="UTF-8">
<i>htmltomd</i> is a simple package <br>for converting HTML to Markdown.
<h2>Getting Started</h2>
pip install htmltomd
<h2>Source code</h2>
<a href="https://github.com/taptorestart/htmltomd" target="_black">github.com/taptorestart/htmltomd</a>
<figure><img src="image.png"><figcaption>Image</figcaption></figure>
result = htmltomd.html_to_md(html)

아래처럼 md로 나온다.

*htmltomd* is a simple package 
for converting HTML to Markdown.

## Getting Started

pip install htmltomd

## Source code




엄청 간단한 프로젝트라 쉬울 줄 알았는데 막상 해보니 고려할 게 많았다. 역시 쉬운 게 없는 거 같다. 그래도 간단한 거라도 배포하니 기분은 좋았다. 


아직 ol, ul 태그 표 등은 지원이 되지 않는다. 일단 ol, ul까지는 작업을 틈나는대로 작업할 계획이다.


과연 몇명이나 다운 받았을까 궁금해서 찾아보니 지금까지 다운로드 수는 155다.

htmltomd 통계(출처: pypistats.org)