数据集和数据系统_AI成为工作中很好用的协同成员了

数据集

数据集的文件组织形式

数据集的构成
    点云 --点云的雷达类型,拼接的雷达类型 点云的文件大小 点云的频率 点云的点数  坐标系
    图像 --命名方式 图像的像素大小 图像的大小 图像的帧率  文件命名方式
    参数-- 内参 外参 标定参数
	视频: 视频的编码格式 视频的帧率 视频的时间长短
	数据的时间同步和空间同步
    标注数据
	    数据格式
        标注的方式 标注的范围 标注的类别 标注的属性  数据的组织形式 数据结果的格式
    	数据的可视化

数据结构

数据结构-- 用以做出专业的反应和判断的依据
     找到问题的解法
	 找到问题的最优解法
	      时间效率和空间效率===实际测试和理论估算
		时间复杂度: 数据体量和时间增长快慢
问题解决者--功能集装箱
iteration
    for while iter   自由度
	嵌套循环--快慢指针法
recrusion 
    tail recrusion   
	
批量操作-并行计算-相同和相似的操作
   标量的循环迭代,数组并行计算--向量化运算	

数据系统

核心的设计理念

 核心设计理念:要么是管理日常运营中持续不断的混乱流程,要么是从日积月累的海量数据中提炼出深刻的洞见。	   	
   市政大厅,一位办事员要处理排着长队的市民
   档案馆 一个庞大的人类知识档案馆,一组研究人员被要求在数千年的记录中寻找规律
 关键不仅在于使用哪个数据库,还在于何时使用每个数据模型	   
规模和意图 --真正优秀的应用之路
       数据规模和数据意图
	     设计要有针对性。认清应用数据的本质,你就能找到合适的工具来完成这项工作。 

数据经验

代码经验 思维方式、解决问题的方式以及你的关心程度。
    代码审查视为一件苦差事。只专注于发现错误,很少从中学习到东西
	没有思考,没有学习,也没有质疑  承担责任,而不仅仅是任务 建立信任,而信任建立领导力
	建立品味 tasting :
	    什么工作做得非常好?  哪些功能让人感觉简洁、优雅 哪些方法可以节省时间 重复使用哪些解决方案?
		什么东西感觉笨重或缓慢? 部分花费的时间比预期的要长? 果有时间你会重构什么?
		 注意到了什么模式? 反复解决类似的问题?
	要记住的一个技巧 要避免的一个错误 下周需要改进的一个方面	 
已经建立的巧妙解决方案 

AI 时代工程师学习路线图

 学习重点的根本转移	需要知道"要实现什么目标"
        系统思维与架构设计: 业务建模与领域知识: AI协作与自动化: 新兴技术趋势: 跨领域技能:
技能门槛的快速下沉
概念优先学习法
    传统方法: 语法 → 示例 → 项目
    AI时代方法: 概念理解 → AI实现 → 原理验证

 传统 
    1. 基础技能层:语法与工具熟练度 2. 中级技能层:框架与架构理解 3. 高级技能层:业务理解与技术领导
 AI时代 
     工程师的核心价值从"如何实现"转向"实现什么"和"为什么这样实现"。	 
	
业务价值转化能力比纯技术能力更重要
 公司组织结构的变化:技术团队规模缩小,但价值密度提升
 我的核心价值是什么? 是AI难以替代的创造力,还是可以被快速复制的技能?
 我在为未来做准备吗? 是在拥抱变化学习新技能,还是在固守传统抗拒改变?

代码编程

1. Copilot 模式:你写头它写尾  
2. Agent 模式:你说话,它写程序  “氛围感编程”
 
 Cursor	
    Cursor 的请求并不是直接走本地,而是 prompt 先会发回它自家的服务器加工一遍,再转发出去	 
    Cline 和 Continue。 它们都支持你自己指定模型接口地址(Base URL)、API Key、模型名称
	   Cline:类 Copilot 体验 + 工程感更强的 AI 编程助手  适合维护老项目或做代码审查
	   Continue:VSCode 上的轻量 AI 辅助                  适合 写中小项目,轻量不打扰  
	   RooCode 支持全平台 + 本地模型 + 精准代码控制
      没有多余的干预,不中转、不劫持	 
	
定义问题、建构系统、引导协作 开源是一种“社会化研发 是“抢标准”的工具	
posted @ 2025-09-08 20:04  辰令  阅读(11)  评论(0)    收藏  举报