ArXiv to EPUB Converter
今年,ArXiv平台新近推出HTML格式论文,旨在提升阅读便捷性和可访问性。此功能目前处于实验阶段,适用于2023年12月1日后提交的TeX/LaTeX格式论文。HTML版本与PDF并行,读者可在网页端直接查看,无需下载。研发团队正致力于完善转换技术,以期未来覆盖所有论文,进一步促进学术交流与科研工作的无障碍化,这一更新特别有助于我这种眼睛不好的人。
为了让论文方便在我的墨水屏上阅读,我让AI(DS和Qwen2.5)帮忙给我写了个Python程序,把html转化为EPUB格式,相比于以前转化PDF的方式(如:GitHub上的arxiv2epub项目),通过html得到的电子书图片排版和文字显示友好。正好最近折腾魔搭(ModelScope),发现可以通过Streamlit部署,所以就放到了魔搭社区的创空间里面,欢迎大家使用。

BUG:由于跨界网络不稳定,图片下载有时候不完整,目前的解决方法是多次运行得到完整图片。

为了让论文方便在我的墨水屏上阅读,我让AI帮忙给我写了个程序,把ArXiv上论文的html转化为EPUB格式。
浙公网安备 33010602011771号