网站首页 > 互联网那些事 正文
学者们多年以来一直试图利用所谓“文体测定学”——即研究个人书面撰写内容中的习惯——解决一些实际问题,例如《联邦党人文集》的作者究竟是谁(有人认为其作者为James Madison、Alexander Hamilton或者John Jay)、《伊利亚特》与《奥德赛》是否全部为荷马所写,以及莎士比亚的十四行诗与戏剧作品是否还拥有其他共同创作者。
现在一支学术团队正与陆军研究实验室协作工作,希望利用这一类型的技术手段识别恶意代码编写者,并以此作为潜在的黑客追查手段之一。
这支团队包括来自普林斯顿大学、德雷塞尔大学以及哥迁根大学的多位研究人员,旨在利用机器学习算法对计算机代码进行解析,进而确定其实际编写者。最终成果是,普林斯顿大学博士后申请者Aylin Caliskan-Islam在第32届Chaos计算机大会上提交了一份报告,根据陆军研究实验室所指出,其能够在1600名程序员当中实现高达94%的作者识别正确率。另外,如果将作者范畴缩小至五名可能性最高的对象时,研究人员几乎每次都能让实际编写者囊括于其中。
这只是一次面向知名程序员们的样本代码的实验室性尝试,而且该研究团队表示他们还需要进一步将自己的工作成果扩展至更加庞大的真实世界环境当中,从而应对不同恶意软件编写者们的开发方式以及代码编写过程中使用的掩饰手段。(陆军研究实验室方面指出,研究人员们还对多个单作者GitHub库中的‘真实世界’代码进行了处理。)最终,这样一套自动化工具包能够帮助我们识别出恶意软件作者,并以此为基础显著推动我们在对抗网络攻击行为时的主动性——即准确了解其实际来源。由于在线攻击活动可能在世界范围内随时出现,因此看起来从中国本土发起的攻击也许并不该由中国方面负责。
安全专家们已经采用这种“文体测定学”方式来确定网络攻击的真实来源,例如提取早先攻击工具中所使用的代码,从而断定索尼影业遭受的侵袭源自朝鲜。不过整个过程需要耗费大量时间。使用一款软件工具能够顺利承担起大量繁重的比照任务,并加快整个检验流程。
“这样的检验过程确实充满挑战,因为以手动方式处理这项任务的专家们需要在攻击出现之后逐步对其进行取证,”陆军研究实验室网络安全研究员兼技术研究负责人Richard Harang表示。“现在,人工分析已经成为一种常规工具。其确切有效,但却往往速度很慢且需要耗费大量资源。我们正着手开发一套工具包,旨在以更快且成本更低廉的方式支持用于恶意人士身份识别的分析工作。”
在内容编写过程中,文体测定学分析方案会根据词汇选择、句型、语法、拼写以及标点符号等对象的使用习惯确定一位编写者的风格“指纹”。正如《纽约时报》所指出,Madison倾向于使用“whilst”,而Hamilton则偏好使用“while”,这就有助于我们确定二者在《联邦党人文集》当中各自撰写了哪些特定部分。
另外,虽然利用这些原则确实能够通过代码编写习惯识别出黑客,但“文体测定学”还带来了其它一些潜在影响,例如找出举报人或者人权活动家的真实身份。事实上,德雷塞尔大学的研究人员曾于2012年发布过其文体测定学工具的早期版本,但同时也公布了另一款名为Anonymouth的工具,旨在帮助作者们掩盖自己的风格特征。
就目前来讲,研究人员只希望不断改进自己的工具。“这项基本研究表明,识别计算机程序基础之上的编码风格及其作者是完全可靠且值得为之付出努力的,”Harang指出。“这是一项协作性研究,而且目前我们已经获得了不错的成果。”
- 上一篇: 移动抽流量10M-1G易语言源码
- 下一篇: Json解析到树形框易语言源码
猜你喜欢
- 2020-08-02 晨风机器人遭逮捕,酷Q跑路
- 2020-04-16 Pandownload开发者被捕,共非法获利30万余元
- 2020-04-08 确诊了!网传WannaRen勒索病毒样本实为解密工具
- 2020-02-27 某破解版易语言或存在后门
- 2019-10-12 近期不要使用TeamViewer 该远程控制软件已被国外黑客攻破
- 2019-06-07 吾爱破解宣布闭站调整:取缔侵权内容
- 2019-05-24 群主发现平台漏洞,带着大家一夜之间盗走1637万元,结果悲剧了...
- 2019-04-22 东南亚是博彩公司的天堂,也是程序员的地狱
- 2019-03-14 博客园大神Vamei-3月1日去世,年仅31岁
- 2019-03-11 揭秘博彩黑产的支付江湖产业链
你 发表评论:
欢迎- 百度站内搜索
- 关注微信公众号
- 网站分类
-
- 网站公告
- 电子书书籍
- 程序员工具箱
- 编程工具
- 易语言相关
- 网络相关源码
- 图形图像源码
- 系统工具源码
- 易语言模块源码
- 易语言支持库
- 数据库类源码
- 易语言例程
- 易语言游戏开发
- 易语言模块
- 多媒体类源码
- 易语言资源网
- 易语言视频教程
- JS分析教程
- 易语言图文教程
- 易语言常见问题及笔记
- 工具源码
- 易语言版本
- 网络编程
- javascript
- PHP编程
- html
- 正则表达式
- 面试题
- nodejs
- 其它综合
- 脚本专栏
- python
- 按键精灵相关
- 按键精灵图文教程
- 按键精灵视频教程
- 按键精灵Q语言
- 按键精灵安卓版
- golang
- 游戏安全
- 火山相关
- 火山安卓软件
- 火山常见问题及笔记
- 火山安卓源码
- 火山视频教程
- 火山PC版本下载
- 火山PC视窗例程
- 互联网那些事
- 引流推广
- 项目揭秘
- 网络营销
- 营销软件
- QQ营销软件
- 娱乐软件
- 机器人插件
- 培训教程
- 技术教程
- 活动线报
- 数据库
- Redis
- Access
- MongoDB
- Mysql
- 问答
- 其它
- 易语言
- 需求
- 在线教程
- 多线程培训班
- 觅风易语言教程
- 模拟系列教程
- 集中营易语言教程
- 历史数据
- 随机tag
本文暂时没有评论,来添加一个吧(●'◡'●)