博客
大模型测试综述
本文全面阐述了大模型应用的质量保障策略。首先介绍了大模型应用的核心组件,随后区分了模型评估和系统评估的不同侧重点,并详细探讨了系统测评指标,涵盖知识能力、安全性和应用性评估。在业务测试方面,强调了明确目标和设计相应指标的重要性,并以具体场景为例进行说明。此外,还分析了提示词攻击的风险及应对策略,并介绍了常见的性能测试指标。最后,总结出大模型质量保障的三个关键阶段:确保模型安全、开展工程测试和持续进行效果评测。本文为大模型应用的质量保障提供了系统性的指导。
August 5, 2024
饮食的迷思:舌尖上的真相
饮食健康不是关于单一食物或营养素,而是而是一个整体系统。多样化、少加工、规律进食是关键。肠道微生物群对健康的影响远超过去认知,而我们的饮食直接塑造着这个微观世界。过度简化的饮食建议往往是有问题的——无论是"零脂肪"、“高蛋白"还是"超级食物”。相比关注单一营养素或食物,更重要的是建立包含多种天然食物的饮食模式,并关注进食时间和规律。
April 16, 2023
过度飲食心理学:解析我们与食物的复杂关系
吃,从来不是单纯的进食,而是一种活动,一种文化,一种可以被影响的行为。而现代商人善于利用我们的 “思考弱点” 去创造更多 “投演化大脑所好” 的商品。
March 19, 2023
DREAM 算法的自适应机制:CR 概率更新与离群链校正
在前面的系列文章中,我们已经探讨了差分进化自适应(DREAM)算法的基本框架、子空间采样技术以及候选点生成与接受机制。这些组件共同构成了DREAM算法的骨架,使其能够有效应对高维参数空间的采样挑战。然而,DREAM 算法真正的智慧在于其自适应机制,它使算法能够根据采样过程中获得的信息不断调整自身行为,从而在各种复杂问题中保持高效性能。本文将深入剖析 DREAM 算法的两个核心自适应机制:交叉概率(CR)的自适应更新和离群链校正,揭示这些机制如何提高算法效率并保证收敛性。
October 3, 2019
DREAM 算法的候选点生成与接受机制
DREAM 算法巧妙地融合了进化计算中的差分进化策略和 MCMC 方法的理论基础,形成了一个强大而灵活的采样框架。我们将从四个方面详细分析这些机制:差分进化策略在候选点生成中的应用、Metropolis 接受准则的使用、候选点生成的数学描述,以及接受机制如何在探索和利用之间取得平衡。通过这些分析,我们将揭示 DREAM 算法如何在保持理论正确性的同时,显著提高了采样效率和适应性。
June 13, 2019
DREAM 算法的核心组件:子空间采样与交叉概率
DREAM 算法的卓越性能使其在复杂参数估计和不确定性分析等领域中崭露头角。然而,DREAM 算法的成功并非偶然,而是源于其精心设计的核心组件:子空间采样技术和交叉概率。这两个组件不仅大大提高了算法在高维空间中的效率,还赋予了算法强大的自适应能力,使其能够在各种复杂问题中表现出色。
May 11, 2019
差分进化自适应 Metropolis 算法的诞生:优化与采样的融合
复杂的优化问题和概率分布采样任务往往涉及高维参数空间、非线性关系和多模态分布,给传统算法带来了巨大挑战。差分进化自适应 Metropolis(Differential Evolution Adaptive Metropolis,DREAM)算法的诞生,正是为了应对这些挑战,它巧妙地融合了优化算法和采样方法的优点,为复杂问题的求解提供了一种新的思路。
April 20, 2019
自适应 MCMC 方法:提高采样效率的尝试
传统的马尔可夫链蒙特卡洛方法在面对复杂的高维分布时,常常面临收敛速度慢、采样效率低下等问题。为了克服这些缺陷,研究人员提出了一系列自适应 MCMC 方法,旨在通过动态调整算法参数来提高采样效率。本文将介绍早期自适应 MCMC 方法的发展,重点关注自适应 Metropolis 算法、自适应提议分布的原理、自适应 MCMC 的优势和挑战,以及其他一些重要的自适应 MCMC 变体。
April 13, 2019
马尔可夫链蒙特卡罗方法概述:概率分布采样的经典方法
在现代统计学和机器学习领域,我们经常需要处理复杂的概率分布。这些分布可能没有简单的解析形式,或者难以直接进行采样。马尔可夫链蒙特卡罗(Markov Chain Monte Carlo,MCMC)方法应运而生,成为解决这类问题的有力工具。本文将深入探讨 MCMC 的基本概念、主要算法以及在贝叶斯推断中的应用,帮助读者全面理解这一重要的统计学方法。
March 23, 2019
差分进化算法简介:优化算法的创新
差分进化算法(Differential Evolution,简称 DE)由 Rainer Storn 和 Kenneth Price 于 1995 年提出。这是一种进化算法,通过不断迭代改进候选解以优化问题,针对给定的质量或适应度指标进行优化。由于其简单性、高效性和鲁棒性,DE 在工程、机器学习和人工智能领域得到了广泛应用。
February 23, 2019