天道不一定酬所有勤
但是,天道只酬勤

最近程序员频繁被抓,如何避免面向监狱编程!?

开发十年,就只剩下这套架构体系了!!

最近,有关程序员因为参与某些项目开发导致被起诉,甚至被判刑的事件发生的比较多:

某程序员因为接了个外包,帮别人写了个软件,结果这个软件被用于赌博导致被抓。

某公司利用爬虫抓取用户信息,最后被发现,导致该公司的程序员被抓。

某P2P公司暴雷,老板跑路,程序员被抓。

中科大博士卖“外挂”非法牟利300多万,被警方逮捕。

那么,作为一个程序员,如何避免这些坑呢?怎样尽可能的保护自己呢?

本文就从爬虫、赌博网站、P2P以及外挂等几个方向来介绍下,作为程序员如何避免面向监狱编程!

由于作者并非专业的法律工作从业者,文中法规部分的引用如有偏差,请指正。希望通过本文可以帮助广大程序员们了解一下有哪些自己的人身自由息息相关的坑。

一、爬虫

爬虫,是互联网时代一项普遍运用的网络信息搜集技术。该项技术最早应用于搜索引擎领域,是搜索引擎获取数据来源的支撑性技术之一。

随着数据资源的爆炸式增长,网络爬虫的应用场景和商业模式变得更加广泛和多样,较为常见的有新闻平台的内容汇聚和生成、电子商务平台的价格对比功能、基于气象数据的天气预报应用等等。

网络爬虫技术为数据收集者提供了极大的便利,也给专业网络爬虫公司带来巨大的收益。所以,很多公司都会有爬虫部门,或者负责开发爬虫的团队,在招聘网站上,也随处可见关于”爬虫工程师”的招聘贴。

-w962

关于这个问题,一直都是比较难定性的,因为爬虫本身只是个工具,就和菜刀一样,所以很多人都拿”菜刀无罪论”、”技术无罪论”来为爬虫辩护。

从网络爬虫的相关案例来看,爬虫的开发及使用者通常有很多理由为自己辩护:

“我爬取的都是这个网站的公开数据,搜索引擎不也是这么做的吗?”

“这与搜索引擎行为类似,只是使用了自动脚本,这是合理使用行为。”

“我已经遵守了它们的robots协议、该网站没有robots协议”

“这些数据我只是个人研究使用,并没有商业目的。”。

那么,爬虫到底犯不犯法?

目前,关于网络爬虫相关的约束,主要是2019年05月28日国家网信办发布的《数据安全管理办法(征求意见稿)》。这份文件主要包含了数据收集、数据处理使用以及数据安全监督管理三个章节。

​基本可以确定的是,如果爬虫使用不当,那么爬虫的开发者是有可能触犯法律的,而根据情况不同,获得的刑罚也有可能有差异。

要看开发和使用爬虫是否犯法,需要从爬什么数据、如何爬取数据以及爬到数据之后怎么用三个方面来判断。接下来就简单分析一下:

爬什么数据犯法?

1、属于著作权法保护的作品

因为有些网站发表的内容,如文章、评论等都是有著作权的,如果只是单纯的通过浏览器查看是不会触犯法律的。

但是,对于有著作权的作品,如果未经著作权人许可,以盈利为目的,对其作品进行复制是会触犯法律的。

根据《中华人民共和国著作权法》第46条:有下列侵权行为的,应当根据情况,承担停止侵害、消除影响、公开赔礼道歉、赔偿损失等民事责任,并可以由著作权行政管理部门给予没收非法所得、罚款等行政处罚: (一)剽窃、抄袭他人作品的; (二)未经著作权人许可,以营利为目的,复制发行其作品的; (三)出版他人享有专有出版权的图书的; (四)未经表演者许可,对其表演制作录音录像出版的; (五)未经录音录像制作者许可,复制发行其制作的录音录像的; (六)未经广播电台、电视台许可,复制发行其制作的广播、电视节目的; (七)制作、出售假冒他人署名的美术作品的。

如果是使用爬虫技术手段爬取数据之后将其保存下来或者传播,并且进行盈利,这种都是属于犯罪的。

2、用户的个人信息或者个人隐私

个人用户的个人信息,即使是用户自己放到一些网站上进行公开或者部分公开,如微博、微信等,不代表这些数据就可以被其他人随便获取!

根据《民法总则》第111条:任何组织和个人需要获取他人个人信息的,应当依法取得并确保信息安全。不得非法收集、使用、加工、传输他人个人信息;

根据《网络安全法》第44条:任何个人和组织不得窃取或者以其他非法方式获取个人信息。因此,如果爬虫在未经用户同意的情况下大量抓取用户的个人信息,则有可能构成非法收集个人信息的违法行为。

所以,如果爬取的数据涉及到个人信息,都是违法的!

还有些爬虫企图绕过权限校验等,爬取用户未公开的信息,如个人私密相册照片等,都是属于侵犯用户的个人隐私的,这种也是违法的。

3、反不正当竞争保护的数据

目前有很多网站中的数据系由用户生成,且该等数据和内容系原告网站的主要竞争力来源。如大众点评上面的店铺评价、评论等信息,携程网上面的关于酒店的评价评论等信息等。

根据《反不正当竞争法》第2条:经营者在市场交易中,应当遵循自愿、平等、公平、诚实信用的原则,遵守公认的商业道德。

那么,未经允许,爬去其他网站的核心数据,很明显并没有遵守自愿、平等、公平、诚实信用的原则。

在大众点评诉百度不正当竞争案件、以及新浪微博诉脉脉不正当竞争等案件中,法院都认定被告未经许可抓取、使用原告网站中的数据的行为,违反了诚实信用原则及公认的道德,损害了互联网的市场竞争秩序,损害了原告的竞争优势,从而构成不正当竞争。

因此,如果抓取大众点评、微博、豆瓣电影、知乎等UGC模式的网站上用户发布的信息,并在自己的产品或者服务中发布、使用该等信息,则有较大的风险构成不正当竞争。

怎么爬犯法?

Hollis为了防爬虫以及未经授权的恶意转载,此处内容已被作者隐藏,请输入验证码查看内容
验证码:
请关注本站微信公众号,回复“验证码”,获取验证码。在微信里搜索“Hollis”或者“hollischuang”或者微信扫描右侧二维码都可以关注本站微信公众号。

参考资料:

https://www.kwm.com/zh/cn/knowledge/insights/legal-issues-concerning-web-crawlers-20180525

https://zhuanlan.zhihu.com/p/66997586

https://www.zhihu.com/question/37767673

https://new.qq.com/omn/20171214/20171214A0M93Z.html

《极客时间——白话法律42讲》:https://time.geekbang.org/column/article/42208

(全文完) 欢迎关注『Java之道』微信公众号
赞(2)
如未加特殊说明,此网站文章均为原创,转载必须注明出处。HollisChuang's Blog » 最近程序员频繁被抓,如何避免面向监狱编程!?
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

HollisChuang's Blog

联系我关于我