二进制代码相似性检测的目的是在无法访问源代码的情况下检测相似的二进制函数,是计算机安全领域的一项重要任务。传统方法通常使用图匹配算法,速度慢...
C/C++漏洞检测数据集汇总
漏洞检测这个方向最近几年尤为热门,尤其是与深度学习技术相结合的研究,同时一些公开可用的数据集的出现也进一步推动了这些技术的发展。本篇文章总结...
关于 Embedding 的个人粗略见解
首先举一个简单的例子:我爱吃饭。 如何将 “我爱吃饭” 这句话转化为可供神经网络输入的数值向量呢? 最传统的方法就是通过 one-hot 编...
7-8月份小结
又来写总结了,本次总结主要在于记录7-8月份所做的工作和自己的心路历程。由于要赶 ICSE 2025 的 ddl (8月3日),因此暑假的第...
DeepDFA: 受控制流分析驱动的有效深度漏洞检测
目前基于深度学习的漏洞检测中性能最高的方法使用的是基于 token 的 transformer 模型,这对于捕捉漏洞检测所需的代码语义来说并...
特征向量可视化方法介绍
在最近的研究中,实验需要结合可视化进行解释分析,于是大致上了解了下目前一些特征可视化的工具,主要分为四种类型:热力图、散点图、线性图和雷达图...
深度学习可解释性方法的一些概念
理解和解释深度学习模型的决策过程和原理。 1 特征可视化 通过可视化神经网络的中间层来理解模型是如何识别和处理输入的,比如卷积核可视化是一种...
利用SHAP算法解释BERT模型的输出
1 何为SHAP? 传统的 feature importance 只告诉哪个特征重要,但并不清楚该特征如何影响预测结果。SHAP 算法的最大...
TXL编程语言环境安装
TXL(Tree Transformation Language)是一种专门用于源代码分析和转换的编程语言。它基于树形结构,可以帮助开发人员...
连接Huggingface报requests.exceptions.SSLError错误
最近在学习使用 SHAP 算法解释 BERT 模型的输出结果,然而在从 Huggingface 上导入模型和数据集的过程中出现了网络连接相关...