摘要: 今天在课上曹明阳,古明源,王梓霖在15分钟内用棉签搭成房子。通过老师测验获得5分 阅读全文
posted @ 2026-03-17 10:39 曹明阳 阅读(3) 评论(0) 推荐(0)
摘要: 学习时间复杂度的基本知识,做了些题目。掌握了关于递归、嵌套循环以及基本知识。在顺序表中学习了基本操作,了解并掌握了线性表的定义、插入、删除等操作。单链表的初始化和头结点、求表长、按值查找和按需查找等以及尾插法和头插法建立单链表。对于双链表和循环链表等目前刚过完知识。 阅读全文
posted @ 2026-03-16 18:18 曹明阳 阅读(1) 评论(0) 推荐(0)
摘要: 读完王概凯先生的《架构漫谈》系列专栏,最大的感受是:这套文章讲的虽然是架构,但落点却远不止于技术。它像一把解剖刀,划开了“架构”这个词的硬壳,露出了里面最柔软但也最核心的部分——人、问题与利益。结合专栏内容与其他读者的共鸣,这套“架构世界观”带来的启示,远比学会一种新框架要深刻。 《架构漫谈》最令人 阅读全文
posted @ 2026-03-13 23:26 曹明阳 阅读(2) 评论(0) 推荐(0)
摘要: 架构是人类为了解决无法问题的方法,通过将复杂问题分块切割进行分工,同时不同的人擅长不同的事。将分块后的任务分发给不同的人,尽可能使每个人做擅长的事,提高效率。最后,安排好大家怎么把各自的成果组装起来。 为什么会出现架构? 人类的大脑无法负载所有的事情,在社会事务愈发繁多的情况下,需要分工协作。本质上 阅读全文
posted @ 2026-03-10 19:48 曹明阳 阅读(4) 评论(0) 推荐(0)
摘要: 项目结构 text LetterCleaning/ ├── src/main/java/com/letter/cleaning/ │ ├── LetterCleaner.java # 主清洗程序 │ ├── LetterMapper.java # Mapper类 │ ├── LetterReduce 阅读全文
posted @ 2026-02-15 20:19 曹明阳 阅读(2) 评论(0) 推荐(0)
摘要: IP封锁 现象:返回 403、429 或超时 解决:使用代理IP池,轮换IP;增加请求间隔 User-Agent检测 现象:提示“请使用正常浏览器” 解决:随机更换 User-Agent(如使用 fake-useragent) 请求频率限制 现象:请求几次后被封 解决:控制请求频率,添加随机延时(如 阅读全文
posted @ 2026-02-15 20:03 曹明阳 阅读(5) 评论(0) 推荐(0)
摘要: python import requests import time import random import csv import os from bs4 import BeautifulSoup from urllib.parse import urljoin import logging fr 阅读全文
posted @ 2026-02-15 19:59 曹明阳 阅读(3) 评论(0) 推荐(0)
摘要: 在开始之前,确保你已经安装了PySpark,这是Spark的Python API。以下是一段简单的代码,用于加载数据并进行简单的转换操作: from pyspark.sql import SparkSession # 创建Spark会话 spark = SparkSession.builder.ap 阅读全文
posted @ 2026-02-15 19:48 曹明阳 阅读(1) 评论(0) 推荐(0)
摘要: import java.util.Arrays; import java.util.List; import java.util.stream.Collectors; public class SparkSimulation { public static void main(String[] ar 阅读全文
posted @ 2026-02-14 21:25 曹明阳 阅读(4) 评论(0) 推荐(0)
摘要: 在Python中,我们可以使用pyspark库来模拟Spark的行为。以下是一个简单的代码示例,展示了如何使用Python来模拟Spark对数据的处理。 from pyspark.sql import SparkSession from pyspark.sql.functions import co 阅读全文
posted @ 2026-02-13 23:32 曹明阳 阅读(6) 评论(0) 推荐(0)