耀扬 - 博客园

Python风格规范

摘要：转自Python风格规范 #分号 ##Tip 不要在行尾加分号, 也不要用分号将两条命令放在同一行. #行长度 ##Tip 每行不超过80个字符例外: 长的导入模块语句注释里的URL 不要使用反斜杠连接行. Python会将圆括号, 中括号和花括号中的行隐式的连接起来 , 你可以利用这个特点. 阅读全文

posted @ 2020-07-15 14:12 耀扬阅读(279) 评论(0) 推荐(0)

Python语言规范

摘要：转自： Python语言规范 #Lint ##Tip 对你的代码运行pylint ##定义: pylint是一个在Python源代码中查找bug的工具. 对于C和C++这样的不那么动态的(译者注: 原文是less dynamic)语言, 这些bug通常由编译器来捕获. 由于Python的动态特性, 阅读全文

posted @ 2020-07-15 13:26 耀扬阅读(438) 评论(0) 推荐(0)

pandas 遍历 dataframe 行数据

摘要： import pandas as pd inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}] df = pd.DataFrame(inp) print(df) # pandas 遍历 dataframe 行数据 for 阅读全文

posted @ 2020-07-14 11:23 耀扬阅读(3608) 评论(0) 推荐(0)

素材库图片下载

摘要： import re import requests import random import time import os.path from bs4 import BeautifulSoup import pymysql user_agent_list = [ "Mozilla/5.0 (Wind 阅读全文

posted @ 2020-07-09 14:49 耀扬阅读(283) 评论(0) 推荐(0)

爬取素材库直接存入mysql数据库

摘要：爬取素材库。直接存入mysql数据库。包含html源码直接存入数据库需要的转义函数。替换掉源码中的html注释语句 import re import requests import random import time from bs4 import BeautifulSoup import p 阅读全文

posted @ 2020-07-08 22:21 耀扬阅读(244) 评论(0) 推荐(0)

网站上传视频要求

摘要：由于互联网大文件传递存在着诸多不稳定因素，建议视频体积不要超过150M。如果是视频时长过长导致的体积较大，建议使用视频剪裁。如果是视频分辨率过高导致的体积较大，建议使用如下压缩方法。大文件压缩方法 ###1、打开格式工厂(3.2.1) ###2、点击 –>MP4 ###3、添加文件 ###4、设置阅读全文

posted @ 2020-07-03 15:22 耀扬阅读(1095) 评论(0) 推荐(0)

动态规划LeetCode377 求方案数

摘要：给定一个由正整数组成且不存在重复数字的数组 nums，找出和为给定目标正整数 target 的组合的个数。顺序不同的序列视作不同的组合。示例：nums = [1, 2, 3]，target = 4。所有可能的组合为： (1, 1, 1, 1) (1, 1, 2) (1, 2, 1) (1, 3) 阅读全文

posted @ 2020-07-02 13:47 耀扬阅读(438) 评论(0) 推荐(0)

动态规划LeetCode322零钱兑换

摘要：参考zzu_Lee https://www.cnblogs.com/hengzhezou/p/11042906.html 感谢题目描述：给定不同面额的硬币 coins 和一个总金额 amount。编写一个函数来计算可以凑成总金额所需的最少的硬币个数。如果没有任何一种硬币组合能组成总金额，返回 - 阅读全文

posted @ 2020-07-01 15:15 耀扬阅读(357) 评论(0) 推荐(0)

TF-IDF算法原理及其使用详解

摘要：拜读了两篇大作，受益匪浅，感谢！这孩子谁懂哈 https://blog.csdn.net/zhaomengszu/article/details/81452907 elly https://zhuanlan.zhihu.com/p/94446764 #如何准确抓住一篇文章内容的关键词？ TF-ID 阅读全文

posted @ 2020-06-18 12:12 耀扬阅读(1562) 评论(0) 推荐(0)

PageRank算法原理与实现

摘要：参考永恒之魂 https://zhuanlan.zhihu.com/p/86004363 讲得非常透彻，感谢！ #1、PageRank ##1.1.简介 PageRank，又称网页排名、谷歌左侧排名，是一种由搜索引擎根据网页之间相互的超链接计算的技术，而作为网页排名的要素之一，以Google公司创阅读全文

posted @ 2020-06-18 10:37 耀扬阅读(1195) 评论(0) 推荐(0)

AC自动机理解

摘要： AC自动机需要自备两个前置技能:KMP和trie树。不要看代码，先理解思路。都不复杂，不理解的可以看我前面的博客。参考了很多网上的教程：https://www.cnblogs.com/hyfhaha/p/10802604.html https://blog.csdn.net/qq_4081607 阅读全文

posted @ 2020-06-17 18:10 耀扬阅读(454) 评论(0) 推荐(0)

最好理解的字符串匹配的KMP算法

摘要：字符串匹配是计算机的基本任务之一。一、KMP 算法简介举例来说，有一个字符串"BBC ABCDAB ABCDABCDABDE"，我想知道，里面是否包含另一个字符串"ABCDABD"？许多算法可以完成这个任务，Knuth-Morris-Pratt算法（简称KMP）是最常用的之一。 KMP 算法是由阅读全文

posted @ 2020-05-30 16:24 耀扬阅读(614) 评论(0) 推荐(0)

Trie树

摘要： Trie这个名字取自“retrieval”，检索，因为Trie可以只用一个前缀便可以在一部字典中找到想要的单词。虽然发音与「Tree」一致，但为了将这种字典树与普通二叉树以示区别，程序员小吴一般读「Trie」尾部会重读一声，可以理解为读「TreeE」。 Trie树，也叫“字典树”。顾名思义阅读全文

posted @ 2020-05-28 12:56 耀扬阅读(152) 评论(0) 推荐(0)

学习wm.concat函数

摘要：转自：https://www.cnblogs.com/qianyuliang/p/6649983.html oracle wm_concat(column) 实现字段合并如： shopping: |u_id| goods| num| | | | | |1 |苹果 |2| |2 |梨子 |5| | 阅读全文

posted @ 2020-04-17 11:55 耀扬阅读(231) 评论(0) 推荐(0)

xgboost学习笔记

摘要：一句话定义xgboost 很简单：Xgboost就是由很多CART树集成。什么是CART树？数据挖掘或机器学习中使用的决策树有两种主要类型：分类树分析是指预测结果是数据所属的类（比如某个电影去看还是不看）回归树分析是指预测结果可以被认为是实数（例如房屋的价格，或患者在医院中的逗留时间）而术阅读全文

posted @ 2020-04-04 15:32 耀扬阅读(215) 评论(0) 推荐(0)

耀扬