提取段落

 from lxml import etree
    from lxml.html import fromstring, tostring

    wb_data = """
        <div class="text" id="text1">
                            <div class="textad" id="ad4"></div>
                            <p><a href="https://www.c114.com.cn/keyword/default.asp?key=%BB%AA%CE%AA" target="_blank" class="keyword">华为</a>昨天发布了Mate50系列<a href="https://www.c114.com.cn/keyword/default.asp?key=%CA%D6%BB%FA" target="_blank" class="keyword">手机</a>,这是全球首款支持北斗卫星消息的大众<a href="https://www.c114.com.cn/keyword/default.asp?key=%D6%C7%C4%DC%CA%D6%BB%FA" target="_blank" class="keyword">智能手机</a>,在无地面<a href="https://www.c114.com.cn/keyword/default.asp?key=%CD%F8%C2%E7" target="_blank" class="keyword">网络</a>信号覆盖环境下,仍可通过畅连App发送消息。</p>
        <p>根据官方注释,作为北斗卫星消息提供移动终端硬件,它们仅支持发送消息,不支持接收,而且需要在空旷、无遮蔽的环境使用。</p>
        <p>这是因为北斗卫星信息目前仅支持发出内容,无法与接收者互动,<strong>这一限制是北斗卫星信息本身的性质决定的,并非Mate 50系列无法做到。</strong></p>
        <p align="center"><img alt="华为Mate50卫星短信每月免费30条 专家:1元/条才不亏本" src="https://image.c114.com.cn/20220907/38/1807676893933871142.jpg"></p>
        <p>好消息是,华为Mate50的卫星<a href="https://www.c114.com.cn/keyword/default.asp?key=%B6%CC%D0%C5" target="_blank" class="keyword">短信</a>功能暂时并不收费,<strong>有网友实测华为提供了每月免费30条的额度</strong>,每月到期会清零额度,下月自动充值30条免费额度。</p>
        <p>目前还是体验期,不确定结束之后华为是否会收费。</p>
        <p>华为Mate50手机支持了<a href="https://www.c114.com.cn/keyword/default.asp?key=%CE%C0%D0%C7%CD%A8%D0%C5" target="_blank" class="keyword">卫星通信</a>,方便用户在紧急情况下求救,不过这样的成本也不低,第一财经采访了多位业内专家,称卫星通信实际上是个亏本买卖。</p>
        <p>有厂商的技术负责人表示,一颗卫星制造到上天成本十来个亿,每年运营维护一个亿,按照10年寿命来看,<strong>也就是说需要一颗卫星每年发2亿条短消息,每条1块钱才不亏本</strong>,目前手机厂商做这个事情,开通<a href="https://www.c114.com.cn/keyword/default.asp?key=%B2%E2%CA%D4" target="_blank" class="keyword">测试</a>时就需要和各方将利益划分清楚。</p>
        <p align="center"><img alt="华为Mate50卫星短信每月免费30条 专家:1元/条才不亏本" src="https://image.c114.com.cn/20220907/42/4630116951170932806.png"> <a href="http://www.c114.com.cn"><img src="https://www.c114.com.cn/news/images/t21.gif"></a></p>
                        </div>
                
            """
    html = etree.HTML(wb_data)
    # 1807676893933871142
    html_data = html.xpath('//p/img/..|//p')
    print(html_data)
    for i in html_data:
        print(etree.tostring(i, method='html' ,encoding='utf-8').decode("utf-8") )

 

posted @ 2022-09-07 16:08  淋哥  阅读(29)  评论(0编辑  收藏  举报