法律大数据,资料结构化是第一步 | 微思客 *法律白话文

编者按:

2012年开始兴起的大数据风潮,事隔多年后也吹进法律圈中,对于法律人而言,这个看似熟悉其实又陌生的名词逐渐在诸多法律名词中开始占有一席之地。在法律领域,从来都不缺乏大量的数据。台湾在过去20年间累积超过1,200万笔的裁判书,如果我们把范围扩张到诉愿决定、评议和交通事件裁决,这个数字将会扩张到2亿笔,在资料分析领域,毫无疑问的这些资料量非常巨大。然而,这些资料可以称作大数据吗?

这股风是否吹进境内的法律界?若有朋友愿意撰写,欢迎赐搞。
wethinker2014@163.com

Barry 郭荣彦| Lawsnote创办人


大量数据=大数据?

2003年司改会对窃盗罪的量刑分析统计结果,是透过人工来统计析;2011年司法院开始着手进行的量刑系统,以既有的判决资料进行量刑的分析,在决定刑度参数的资料,至今仍倚赖人工进行资料的撷取。 2016年新立委上任,有立委希望知道通奸罪对配偶撤告的比例,因为统计室没有预先统计这方面的资料,导致必须依赖大量人工重新统计。所有法实证研究的分析,我们可以发现一个共通点,就是人工!我们需要人工去撷取资料,才能透过这些撷取出来的资料进行分析。人工在法实证研究上,是一个无法免除的过程。一旦数据要经过人工撷取才能被电脑统计分析,纵使原始资料量非常庞大,离所谓的大数据还是有很长的一段路要走,因为人工成本极其昂贵,并且处理的资料量非常有限。

繼續閱讀 “法律大数据,资料结构化是第一步 | 微思客 *法律白话文"