deephub

2024年2月17日

摘要：上篇文章中我们主要总结了非线性的降维技术，本文我们来总结一下常见的线性降维技术。 1、Principal Component Analysis (PCA) Principal Component Analysis (PCA) 是一种常用的降维技术，用于将高维数据集转换为低维表示，同时保留数据集的主要阅读全文

posted @ 2024-02-17 10:13 deephub 阅读(71) 评论(0) 推荐(0)

2024年2月16日

机器学习中的10种非线性降维技术对比总结

摘要：降维意味着我们在不丢失太多信息的情况下减少数据集中的特征数量，降维算法属于无监督学习的范畴，用未标记的数据训练算法。尽管降维方法种类繁多，但它们都可以归为两大类:线性和非线性。线性方法将数据从高维空间线性投影到低维空间(因此称为线性投影)。例子包括PCA和LDA。非线性方法提供了一种执行非线性阅读全文

posted @ 2024-02-16 13:17 deephub 阅读(103) 评论(0) 推荐(0)

2024年2月15日

Lag-Llama:第一个时间序列预测的开源基础模型介绍和性能测试

摘要： 2023年10月，我们发表了一篇关于TimeGPT的文章，TimeGPT是时间序列预测的第一个基础模型之一，具有零样本推理、异常检测和共形预测能力。虽然TimeGPT是一个专有模型，只能通过API访问。但是它还是引发了对时间序列基础模型的更多研究。到了2024年2月，已经有了一个用于时间序列预测的阅读全文

posted @ 2024-02-15 09:45 deephub 阅读(208) 评论(0) 推荐(0)

2024年2月14日

使用MICE进行缺失值的填充处理

摘要：在我们进行机器学习时，处理缺失数据是非常重要的，因为缺失数据可能会导致分析结果不准确，严重时甚至可能产生偏差。处理缺失数据是保证数据分析准确性和可靠性的重要步骤，有助于确保分析结果的可信度和可解释性。在本文中，我们讲重点介绍MICE。 MICE（Multiple Imputation by Cha 阅读全文

posted @ 2024-02-14 10:16 deephub 阅读(127) 评论(0) 推荐(0)

2024年2月13日

使用LORA微调RoBERTa

摘要：模型微调是指在一个已经训练好的模型的基础上，针对特定任务或者特定数据集进行再次训练以提高性能的过程。微调可以在使其适应特定任务时产生显着的结果。 RoBERTa（Robustly optimized BERT approach）是由Facebook AI提出的一种基于Transformer架构的预训阅读全文

posted @ 2024-02-13 11:58 deephub 阅读(254) 评论(0) 推荐(0)

2024年2月12日

使用PyOD进行异常值检测

摘要：异常值检测各个领域的关键任务之一。PyOD是Python Outlier Detection的缩写，可以简化多变量数据集中识别异常值的过程。在本文中，我们将介绍PyOD包，并通过实际给出详细的代码示例 https://avoid.overfit.cn/post/9df020be7be84d759ae 阅读全文

posted @ 2024-02-12 10:54 deephub 阅读(153) 评论(0) 推荐(0)

2024年2月11日

使用UMAP降维可视化RAG嵌入

摘要：大型语言模型（LLMs）如 GPT-4 已经展示了出色的文本理解和生成能力。但它们在处理领域特定信息方面面临挑战，比如当查询超出训练数据范围时，它们会产生错误的答案。LLMs 的推理过程也缺乏透明度，使用户难以理解达成结论的方式。检索增强生成（RAG）在 LLMS 的工作流程中添加了一个检索步骤，阅读全文

posted @ 2024-02-11 10:23 deephub 阅读(81) 评论(0) 推荐(0)

2024年2月10日

2024年应该关注的十大人工智能创新

摘要：人工智能（AI）不再只是一个流行词，它已成为我们日常生活的重要组成部分。人工智能在去年深入地融入我们社会的各个方面，改变我们的生活方式、工作方式以及与技术互动的方式。今年是大年初一，我们将探讨2024年可能出现的十大人工智能创新，拥抱这些即将到来的人工智能创新，可以为一个充满激动和变革的未来做好准阅读全文

posted @ 2024-02-10 14:06 deephub 阅读(57) 评论(0) 推荐(0)

2024年2月9日

从模型到前端，你应该知道的LLM生态系统指南

摘要： LLM在在2023年发展的风生水起，一个围绕LLM的庞大生态系统正在形成，本文通过介绍这个生态系统的核心组成部分，来详细整理LLM的发展。 https://avoid.overfit.cn/post/e320df1e77624fbbb6f84c5b5c2dc351 阅读全文

posted @ 2024-02-09 10:58 deephub 阅读(53) 评论(0) 推荐(0)

2024年2月8日

Python进行AI声音克隆的端到端指南

摘要：人工智能语音克隆是一种捕捉声音的独特特征，然后准确性复制它的技术。这种技术不仅可以让我们复制现有的声音，还可以创造全新的声音。它是一种彻底改变内容创作的工具，从个性化歌曲到自定义画外音，开辟了一个超越语言和文化障碍的创意世界。本文的将提供利用AI语音克隆技术-通过训练自定义模型将任何音频转换为选定阅读全文

posted @ 2024-02-08 10:46 deephub 阅读(213) 评论(0) 推荐(0)

overfit深度学习

公告