所属成套资源:【新课标】川教版信息技术九年级上册PPT课件+教案+素材全套
初中信息技术川教版(2019)九年级上册第三单元 我的课外读物——网络爬虫第3节 爬虫中的法律和道德完美版ppt课件
展开这是一份初中信息技术川教版(2019)九年级上册第三单元 我的课外读物——网络爬虫第3节 爬虫中的法律和道德完美版ppt课件,文件包含新课标川教版2019信息技术九上33《爬虫中的法律和道德》课件pptx、新课标川教版2019信息技术九上33《爬虫中的法律和道德》教案docx等2份课件配套教学资源,其中PPT共18页, 欢迎下载使用。
学习完网络爬虫的知识,我们可以在网络上更好的获取所需要的信息,在获取信息的过程中需要注意什么?
在编写爬虫程序获取信息的过程中要遵守相关的道德准则和法律法规,接下来我们来详细的了解一下。
全国人民代表大会常务委员会在2016年11月7日通过了《中华人民共和国网络安全法》在2017年6月1日正式实施。
《中华人民共和国网络安全法》是为保障网络安全,维护网络空间主权和国家安全、社会公共利益,保护公民、法人和其他组织的合法权益,促进经济社会信息化健康发展而制定的法律。
网络安全法共有7章79条;在内容上有6方面突出亮点。
1.明确了网络空间主权的原则
2.明确了网络产品和服务提供这的安全义务
4.进一步完善了个人信息保护原则
5.建立了关键信息基础设施安全保护制度
6.确立了关键信息基础设施重要数据跨境传输的规则
3.明确可网络运营者的安全义务
《中华人民共和国网络安全法》规定:
任何个人和组织使用网络应当遵守宪法法律,遵守公共秩序,尊重社会公德,不得危害网络安全,不得利用网络从事危害国家安全、荣誉和利益,煽动颠覆国家政权、推翻社会主义制度,煽动分裂国家、破坏国家统一,宣扬恐怖主义、极端主义,宣扬民族仇恨、民族歧视,传播暴力、淫秽色情信息,编造、传播虚假信息扰乱经济秩序和社会秩序,以及侵害他人名誉、隐私、知识产权和其他合法权益等活动。
法律规定:任何个人和组织不得窃取或者以其他非法方式获取个人信息,不得非法出售或者非法向他人提供个人信息;爬取数据过程中不应侵犯他人的知识产权。
在编写爬虫程序时我们该如何避免风险?
1.严格遵守网站设置的rbts协议;2.在规避反爬虫措施的同时,需要优化自己的代码,避免干扰被访问网站的正常运行;3.在设置抓取策略时,应注意编码抓取视频、音乐等可能构成作品的数据,或者针对某些特定网站批量抓取其中的用户生成内容;4.在使用、传播抓取到的信息时,应审查所抓取的内容,如发现属于用户的个人信息、隐私或者他人的商业秘密的,应及时停止并删除。
Rbts协议, 又称作爬虫协议,全名是网络爬虫排除标准( RbtsExclusin Prtcl) ,用来告诉爬虫和搜索引擎哪些页面可以爬取,哪些不可以爬取,通常是一个 rbts.xt文本文件,一般放在网站的根目录下。搜索引擎爬虫爬取的网站的第一个文件便是Rbts文件,可以在浏览器的地址栏上使用“主域名/rbts.txt”来查看。
那么通过上图中我们可以看到里面有很多脚本语言,主要是下面两种:
1.User-agent:爬虫名称代表下面设置的规则对这个“爬虫名称”是有效的,如果有很多条的“User-agent:”,就会有多个爬虫受到限制。如“User-agent:Baiduspider”,是指对百度爬虫有限制。
2.Disallw:目录指定不允许爬取的目录,如果只为/,则表示不允许爬取所有页面。如“Disallw;/baidu。
Allw:目录指定允许爬取的目录,用木排除某些限制,一般是和Disallw一起使用,不会单独使用。
除了以上两种,我们可能会在其他的测试链接看到“Allw”
思考以下几个案例是否遵守了相关的法律法规。
周先生在个人网站上增加了“美食探店”“玩转**市”等栏目。编写了一个爬虫程序,将相关的景区、商铺、美食店家的简介、好评数、相关评价等内容爬取出来,直接放置到其中。
公开的数据不一定被允许使用在第三方盈利,周先生的做法存在一定的法律风险。成熟的大数据公司在爬取并使用一个网站的数据时,一般都需要专业的律师进行审核,看是否有禁止爬取或者禁止用于商业用途的相关内容。
公司A向网络用户提供生活服务App,主要内容是商户基本信息及点评信息。公司B使用技术手段在此App上爬取了商户的基本信息及点评信息,用户使用其运营的地图App查询位置时,无须跳转至A公司运营的生活服务App界面,就可直接在地图App界面获取商户的基本信息和点评信息。
不符合,公司B使用技术手段爬取并使用公司A软件平台用户点评等内容,被认定为构成不当竞争。
小李参加了一场大型考试,考试主办方不公开全部的成绩和排名,小李编写一个爬虫程序,从主办方的网站上爬取到了所有参考人员的成绩和排名,进行整理后发布在了社交网站上。
不符合,每个人只能通过登录自己的账号查看自己的成绩。编写程序获取所有人的成绩,甚至在社交网络公开数据,侵犯了其余参考人员的隐私,并且违反了考试主办方的相关规定。
小明在某电商平台开了一家网店,通过爬虫程序筛选了顾客的个人信息,包括姓名、电话号码、购买物品、购买金额等相关的信息。将这些信息转售给某组织。
不符合,法律规定在爬取数据过程中,不得窃取或以其他方式获取个人信息,并且不得非法出售或者。向他人提供个人信息。
任何个人和组织不得窃取或者以其他非法方式获取个人信息
不得非法出售或者非法向他人提供个人信息
爬取数据过程中不应侵犯他人的知识产权
在编写爬虫程序时一定要遵守相关的道德准则和法律法规
《中华人民共和国网络安全法》 2017年6月1日正式实施。
相关课件
这是一份信息技术第2节 安装家庭云公开课ppt课件,文件包含新课标川教版2019信息技术九上12《安装家庭云》课件pptx、新课标川教版2019信息技术九上12《安装家庭云》教案docx等2份课件配套教学资源,其中PPT共50页, 欢迎下载使用。
这是一份初中信息技术川教版(2019)九年级上册第1节 认识家庭云精品课件ppt,文件包含新课标川教版2019信息技术九上11《认识家庭云》课件pptx、新课标川教版2019信息技术九上11《认识家庭云》教案docx、四种常用方法建立家用NAS网络存储mp4、家庭云介绍视频mp4、海尔云生活mp4等5份课件配套教学资源,其中PPT共30页, 欢迎下载使用。
这是一份初中信息技术川教版(2019)八年级上册第1节 “初识”人脸课文内容课件ppt,文件包含2022年川教版2019信息技术八年级上册第二单元第1节“初识”人脸课件第1课时共23页pptx、2022年川教版2019信息技术八年级上册第二单元第1节“初识”人脸教案第1课时共1课时docx、2022年川教版2019信息技术八年级上册第二单元第1节”初识“人脸练习答案docx、2022年川教版2019信息技术八年级上册第二单元第1节”初识“人脸练习题目docx、认识人脸识别mp4等5份课件配套教学资源,其中PPT共23页, 欢迎下载使用。