显示带有标签的帖子 电子发现. 显示所有帖子
显示带有标签的帖子 电子发现. 显示所有帖子

2011年12月11日,星期日

就绪相关性估算器

你不’t know what 预测编码 is?  也许这并不令人感到意外,因为几乎所有参与2010年10月预测编码调查(由eDiscovery出版)的贡献者都同意的事情是,用比预测编码更好的术语来描述他们的工作。 

真可惜,因为 predictive coding 技术有望成为解决诉讼人如今在发现时面对的电子文档的最重要的进步。 (持怀疑态度的相反观点 这里)
In a nutshell, 预测编码 tools enable the lawyers to review a sample of the overall document collection and decide whether each document in the sample is relevant or irrelevant.  该工具分析审稿人’做出决定,然后评估集合的其余部分,为集合中的每个文档赋予相关性等级。 
每种工具的方法略有不同,例如,有些方法更具迭代性,但是’s the gist.  希望是,由于任何给定的电子文档集合中的绝大多数都是不相关的,因此可以高度自信地将大多数文档排除在人工审查之外–一种很好的方法,它很好地强调了英语程序规则中的比例性。
那么我们该怎么办呢?
我自己的幻想是这篇文章的标题。  但这并不是一个严肃的通用术语,尽管您永远不会知道–相关性推算者,有人吗? 但是即使那样也不能传达 消息,这些工具使用户能够识别不相关的内容, rather than relevance.  由于从人的角度出发,该技术的关键点是从子集开始并最终丢弃大部分文档的能力,因此 合适的通用术语将由此产生–样本驱动的筛选,也许吗? 不相关的剔除者?垃圾探测器?
嗯,也许我们’re stuck with 预测编码 after all.  它必须比eDiscovery Institute Survey的贡献者建议的替代方案之一更好:‘预后文件分析’.

[2012年5月1日更新。 现在,预测编码似乎正在演变为计算机辅助审查。 不完美,但更好。]