seekwhale13

2025年1月9日

前端大模型入门（三）：编码(Tokenizer)和嵌入(Embedding)解析 - llm的输入

摘要：备份阿里云文章：https://developer.aliyun.com/article/1628074#:~:text=简介：本文介绍了大规模语言模型（LLM）中的两个核心概念：Tokenizer和Embedding。,Tokenizer将文本转换为模型可处理的数字ID，而Embedding则将阅读全文

posted @ 2025-01-09 21:42 seekwhale13 阅读(1817) 评论(0) 推荐(0)

2024年12月19日

摘录

摘要： Awesome-Compositional-Zero-Shot Papers and codes about Compositional Zero Shot Learning(CZSL) for computer vision are present on this page. Besides, t 阅读全文

posted @ 2024-12-19 17:15 seekwhale13 阅读(81) 评论(0) 推荐(0)

2024年11月29日

Clip模型使用

摘要：代码文件结构 clip.py CLIP模块提供了以下方法： clip.available_models() 返回可用的CLIP模型的名 import clip models = clip.available_models() print(models) #结果 ['RN50', 'RN101', ' 阅读全文

posted @ 2024-11-29 11:42 seekwhale13 阅读(1653) 评论(0) 推荐(0)

2024年10月30日

论文阅读-CORA: Adapting CLIP for Open-Vocabulary Detection with Region Prompting and Anchor Pre-Matching

摘要：摘要开集词汇检测（OVD）是一项目标检测任务，旨在检测训练检测器的基类之外的新类别对象。最近的开集词汇检测方法依赖于大规模的视觉-语言预训练模型，如CLIP，以识别新对象。我们确定了在将这些模型纳入检测器训练时需要解决的两大核心障碍：（1）当将训练于整幅图像的VL模型应用于区域识别任务时出现的分布阅读全文

posted @ 2024-10-30 09:42 seekwhale13 阅读(231) 评论(0) 推荐(0)

2024年10月25日

论文阅读-Learning to Predict Visual Attributes in the Wild

摘要：摘要视觉属性构成了场景中包含信息的大部分。物体可以使用多种属性来描述，这些属性展现了它们的视觉外观（颜色、纹理）、几何特征（形状、大小、姿态）以及其他内在属性（状态、动作）。现有工作大多局限于特定领域内的属性预测研究。在本文中，我们介绍了一个大规模的野外视觉属性预测数据集，该数据集包含超过260K 阅读全文

posted @ 2024-10-25 17:01 seekwhale13 阅读(119) 评论(0) 推荐(0)

ssh隧道进行web app

摘要：是的，使用SSH隧道可以通过SOCKS代理来实现在浏览器中打开网页。以下是步骤：设置SSH隧道：首先，你需要设置一个SSH动态端口转发（SOCKS代理）。这可以通过以下SSH命令完成： ssh -D 本地端口用户名@远程服务器地址:22 #例子 ssh -D 7891 root@123.444. 阅读全文

posted @ 2024-10-25 11:32 seekwhale13 阅读(434) 评论(0) 推荐(0)

2024年10月21日

论文阅读-ArtVLM: Attribute Recognition Through Vision-Based Prefix Language Modeling

摘要：摘要识别并从对象中分离视觉属性是许多计算机视觉应用的基础。虽然像CLIP这样的大型视觉-语言表示在很大程度上解决了零样本对象识别的任务，但零样本视觉属性识别仍然是一个挑战，因为CLIP通过对比学习得到的视觉-语言表示无法有效捕捉对象-属性依赖关系。在本文中，我们针对这一弱点提出了一个基于句子生成的阅读全文

posted @ 2024-10-21 20:41 seekwhale13 阅读(155) 评论(0) 推荐(0)

2024年9月13日

linux 下的解压

摘要： 1.要解压缩zip文件，可以使用以下命令： unzip file.zip12 2.要解压缩tar文件，可以使用以下命令： tar -xvf file.tar1 3.要解压缩tar.gz文件，可以使用以下命令： tar -xzvf file.tar.gz1 4.要解压缩tar.bz2文件，可以使用以下阅读全文

posted @ 2024-09-13 16:19 seekwhale13 阅读(33) 评论(0) 推荐(0)

2024年9月3日

论文阅读01-Improving Closed and Open-Vocabulary Attribute Prediction using Transformers

摘要：摘要我们研究在视觉场景中识别对象的属性。我们将属性视为描述对象的物理和语义属性以及其与其他对象关系的任何短语。现有工作在封闭环境下研究属性预测，并使用一组固定的属性，实现了一个使用有限上下文的模型。我们提出了TAP，这是一个新的基于Transformer的模型，可以在单个前向传递中利用上下文并为场阅读全文

posted @ 2024-09-03 10:19 seekwhale13 阅读(62) 评论(0) 推荐(0)

论文精读

摘要：如何读一篇论文第一步阅读 title、abstract 和 figures。通过阅读 title、abstract、figures 和实验部分，可以对论文有一个大致的理解。大部分深度学习论文，都会总结出一两张图片让你理解起来更方便，而不需要通过阅读整篇论文。第二步阅读 introductio 阅读全文

posted @ 2024-09-03 09:59 seekwhale13 阅读(117) 评论(0) 推荐(0)

公告