自助批量下载Confluence文档内容

Confluence非常的便捷项目上几乎所有的资料都在Confluence上进行管理和编辑,连Office都省了。但是存档的时候就比较麻烦了。只有管理员批量导出的权限,个人只能一个一个导出,因此写一个可以相对简单批量导出的教程

  1. Confluence是可以使用如下方式进行导出文章到Word, 注意由于PDF是异步导出的因此不适合使用该方式。
    https://xxx.atlassian.net/wiki/exportword?pageId=275939810

  2. 在文档空间的Pages页面获得所有页面链接,可以在Chrome中安装Simple Auto Scroll 插件自动滚动页面获得所有链接。
    https://xxx.atlassian.net/wiki/spaces/Doc/pages

  3. 将页面保存为本地HTML文件,用Sublime打开页面原文件,使用如下正则表达式搜索所有链接
    https://xxx.atlassian.net/wiki/spaces/Doc/pages/[0-9]{2,20}

  4. 在HTML中写入如下脚本将Body部分的链接替换为实际链接,脚本为自动按间隔时间访问链接导出文章为Word文档。

<!DOCTYPE html>
<html>
<head>
	<meta charset="utf-8">
	<title></title>
	<style>
a:link {color:#000000;}   
a:visited {color:#00FF00;}  
a:hover {color:#FF00FF;}  
a:active {color:#0000FF;}  
</style>
	<script type="text/javascript">
		var count = 1;
        var sh;
        function counter(){
            sh = setInterval(jishi,10000);
        }
        function jishi(){
        document.getElementById("progress").innerText=count
        	var result = document.getElementById(count);
          result.click();
          count++;
        }
        window.onload = counter;
	</script>
</head>
<body>
	Downloading: <label id="progress"></label><br/>
	1. <a id='1' href='https://xxx.atlassian.net/wiki/exportword?pageId=17399813'>https://cjdfintech.atlassian.net/wiki/exportword?pageId=17399813</a><br/>
<a id='2' href='https://xxx.atlassian.net/wiki/exportword?pageId=264374329'>https://cjdfintech.atlassian.net/wiki/exportword?pageId=264374329</a><br/> 
</body>
</html>

因为Chrome会多次弹弹窗提示从一个网站上的多文件下载,因此建议使用Firefox进行浏览本页面和下载。

另外如果有些文章比较大,设置的超时时间内可能下载不完,可以使用如下命令获得已下载文件链接再与所有文章链接做个筛选,整理出新的下载列表。
mdls *.doc |grep xxx.atlassian.net/wiki

posted on 2021-09-20 09:11  Gary Zhang  阅读(76)  评论(0编辑  收藏  举报

导航