面试准备

面试考察的点:
1、项目
你每个项目都能讲出来嘛 确保每个项目都能讲好--STAR
2、八股 八股这里我认为不应该是自己的优势区间---复习自己常考的和知道的
3、算法题--既然在准备面试 就不要说自己没有手感这种话

金字塔

别人提问

先从上面四个方面去定位对方的问题在哪个环节,然后再去讲

Todo

1、项目演讲稿
2、ai手撕

面试表达能力提升

背景:题主在面试的时候被说表达有点问题,反思后发现自己所有的讲述和提问都是根据感觉来答的。怀疑问题就在这里?打算系统的学一下。

计划

面试主要三个模块:
1、讲解项目模块
2、固定知识提问模块
3、开放题回答模块
本质上是练一个逻辑,从碎片表达到一个框架化输出,我的计划就是去学习一个框架然后再面试的时候有意识的去使用这个框架来针对这三个做一个定点的回答:
1、讲解项目STAR
(就和论文一样,背景挑战方法结果)
情景-挑战-解决方法-结果
2、提问MECE
如何解决模型的梯度爆炸和梯度消失?
(先思考,拆问题)
相互独立
1、梯度爆炸的原因和解决
2、梯度消失的原因和解决
完全穷尽
讲一再讲二
3、开放题PREP
被问过:你认为为什么会有混排这个链路?
框架可以灵活发挥
P(观点):直接说你的核心结论?
(这个例子可以省略)
R(理由):为什么这么认为?
(先思考答什么,思考完分点)
1、一个是系统上来说,整个业务链路上需要一个统一的合并结果的链路
2、从产品和算法程序员本身来看
在链路的尾部适合做规则的引入
同时混排链路是少数能接收多方item的链路,数据的多样性对程序员来说可做的点会更多
E(例子):
例如用户体验的一些规则,不适合在独立的链路去做
比前前链路的信息更多,做的就会更细,也会更有效果
P(再次强调):重复一遍
所以我认为从系统本身的角度和互联网从业者的角度来说,混排都有存在的必要性和理由。

核心

我认为我目前的核心是在被提问的时候的思考时间太短,急于答复,我应该控制自己多给自己一些思考时间
思维链:被提问->想框架->思考问题如何被拆解然后放入框架内->回答

对自己的项目打一个腹稿

对于自己的一个项目,它为什么,这么做,关键是让不懂行的人去理解你这个工作。

Todo

1、逼自己刷题,刷dp 搜索等题
2、给自己的项目写稿子

3S-ECG论文演讲稿

我们做的是一个 ECG 的自监督学习框架,叫 3S-ECG,核心目标是:在标签极少的情况下,同时提升静态 ECG 和动态 ECG 的分类效果。这里最大的挑战是:
静态 ECG 比较干净,但异常模式很 subtle;动态 ECG 噪声很大,但时序信息更丰富;现有方法往往只能兼顾一边。比如:
reconstruction-based 方法鲁棒,但判别性不足;contrastive learning 判别性强,但对噪声敏感。
所以我们提出了一个 Three-Stage Self-Supervised Framework:
第一阶段用 MAE 学 ECG 的基础结构
第二阶段用 semi-frozen NNCLR 增强判别性
第三阶段 full fine-tune 做全局特征对齐

同时我们还做了两个 ECG-specific 的设计:

R-peak weighted masking;ECG-aware augmentation。
最后在多个公开 ECG 数据集上,相比 SOTA 提升了 5%-10%。

设计一:

ECG 的诊断信息高度集中在:R-wave,QRS complex,rhythm pattern。

如果随机 mask,很可能大量 mask 到“无意义区域”,模型学到的是平滑重建周期拟合,而不是生理关键特征,所以我们做了:
R-peak weighted masking,即让包含 R-wave 的 patch 有更高概率被 mask。这样会逼着模型主动学习 ECG 最核心的结构。

设计二:

直接从 MAE 切到 contrastive learning,
容易发生:representation collapse / feature drift 因为 contrastive objective 更 aggressive。
所以我们:freeze 前面层,只训练后面 Transformer block。让模型保留 morphology knowledge,再增强 discrimination。本质上是先学“结构”,再学“区分能力”

为什么是三阶段?

第一阶段:MAE

目的:学稳定的基础 ECG representation。

prototype演讲稿

我们做的工作叫 PDFTime,主要解决的是时间序列分类里的两个核心问题:
类间高度相似(high inter-class similarity),类内分布高度多模态(intra-class multi-modality)。比如 ECG、动作识别、传感器数据里:同一个类别内部可能存在很多不同形态,但传统分类头通常默认:“一个类别对应一个中心” 也就是 single-center assumption。但这个假设在时间序列里其实是失效的。举个例子:同样是 heartbeat abnormal,不同病人的波形可能差异很大;或者动作识别里同一个动作由于:速度不同,幅度不同,个体差异会形成多个 feature cluster。

但传统 linear head是:一个 weight vector 对应一个类。所以它很难表达:多模态类内结构和复杂决策边界,
这会导致:
feature entanglement,prototype drift,decision boundary 不稳定。所以我们做的核心事情是: 把 prototype 从“描述工具”变成“决策边界本身”。也就是说:传统 prototype 方法只是辅助 feature learning;我们直接让 prototype hierarchy参与最终分类推理。

这里我们设计了两个核心模块:

MFRU

用于 multi-scale frequency-aware feature extraction。

因为时间序列同时包含:
局部 temporal motif,全局 frequency pattern。普通 convolution 很难同时建模,所以我们通过:
multi-receptive-field,frequency weighting 增强不同时间尺度的信息融合。

GTCE

做全局 context aggregation,建模 long-range dependency

posted @ 2026-05-16 09:37  invisible|•ω•`)  阅读(4)  评论(0)    收藏  举报