2020年3月20日

河北累计承接京津转入基本单位9773个

新华社石家庄2月26日电(记者闫起磊)记者26日从河北省发改委获悉,2014年以来,河北省累计承接京津转入基本单位9773个,有力促进了全省产业结构优化,2018年三次产业结构实现由“二三一”到“三二一”的历史性转变。

据河北省发改委相关负责人介绍,京津冀协同发展六年来,河北省借力京津产业优势和科技资源,加强上下游合作,理顺产业发展链条,调整优化产业结构,形成了一批产业聚集区,如张家口可再生能源示范区、北戴河生命健康产业创新示范区、石家庄高端生物医药产业基地等,保定和沧州汽车装备制造产业初具规模,环首都地区高新技术产业和现代服务业蓬勃发展。

据介绍,河北始终把疏解北京非首都功能作为“牛鼻子”,着力打造承接平台,有序对接、精准承接、合理布局,确保北京非首都功能转得出、留得下、发展好。目前,河北正以雄安新区集中承载地为核心,曹妃甸区、渤海新区、津冀芦台·汉沽等5个协同协作平台为重点,4个特色专业平台和33个个性化平台为支撑,集中打造“1+5+4+33”重点承接平台体系,承载能力和吸引力不断增强。

这种想法源于机器学习在社会中的历史用途:它的现代技术是为例如在线广告、网络搜索之类的低风险决策而诞生,这些决策不会对人类的生活造成深远的影响。

并非一定要在准确的机器和具有理解能力的人之间做出选择,如此理解它有助于我们诊断由黑盒模型在整个社会中进行高风险决策所导致的问题。这些问题不仅存在于金融领域,而且还存在于医疗保健,刑事司法等领域。

黑盒模型在医疗领域中的一个常见问题是数据泄露,关于标签变量 y 的某些信息以通过查看变量的标题和描述变量这种你可能不会觉察的方式,潜入变量 x 中:有时你认为自己正在预测将来的事物,但你只是在探测过去发生的事情。在预测医疗结果时,机器可能会利用医生笔记中的信息,将这些信息在正式记录患者病情之前透露出来,因此错误地将其声明为成功的预测。

雷锋网(公众号:雷锋网) AI 科技评论编译。雷锋网雷锋网

例如,当 ProPublica 的记者试图为累犯预测专设的COMPA模型解释时(Angwin et al., 2016),他们似乎错误地认为,如果一个人可以建立一个近似于比较的线性模型,并依赖于种族、年龄和犯罪历史,那么COMPAS本身必须依靠种族。

虽然 2% 的死亡率比 15%的死亡率要好很多,但是以这种方式来架构 AI 系统的风险,会掩盖一个更基本、更有趣的考虑:为什么机器人必须是黑盒?如果机器人具有自我解释能力,它将会失去执行准确手术的能力吗?机器人与患者之间的有效沟通是减少病人的护理而不仅仅只是改善吗?病人难道不需要在手术前向机器人说明他们有凝血障碍吗?

自2002年成立以来,宾臣传媒充分利用企业经营资源大力开展公益宣传,先后推出“保护环境”“绿色出行”“普法教育”“公共卫生”“社会治安”“垃圾分类”“助残扶贫”“义务献血”“全民控烟”“全民禁毒““315消费者权益”“节水环保”等数十项主题公益宣传活动,为服务社会精神文明建设,推动社会公益事业健康有序发展作出了突出贡献。基于此,公司赢得了多项殊荣——英国面向中国企业颁发的“企业社会责任优秀实践奖”、中国企业信用评价中心颁发的“全国诚信经营示范单位”称号、多部门联合颁发的“最具社会责任诚信品牌”称号、文化部相关部门颁发的国家最高公益奖项“黄河奖”等。

一批重大项目建设进展顺利,如京津冀大数据走廊项目——张北云联数据中心、承德德鸣大数据产业园投产运营,首钢京唐钢铁二期一步工程完工,中船重工涿州海洋装备科技产业园、京东集团华北(廊坊)云数据中心等项目加快建设,总投资320亿元的唐山液化天然气项目和配套外输管线项目获国家发改委核准,北京·沧州渤海新区生物医药产业园吸引了140家医药企业落户。

我们所看到的每一个复杂度适中的数据集都存在缺陷。这些范围可以从大量的丢失数据(不是随机丢失)或者无法测量的数据混淆到数据集中的系统错误(例如药物治疗的错误编码),数据收集出现的问题,导致数据分布与最初的设想不一致。

三年级的语文期末考试内容已经让家长们焦头烂额以为,小学四年级的语文内容更是超过了三年级的题量。

还有一些内容课文必读书目的内容也算比较难,第一题问:烽火三少年的故事发生在哪里?这不是课本上的内容,如果你没有读过这本书你根本不知道故事的发生地点。还有第四题《长袜子皮皮》的袜子是什么颜色的?和第五题的《夏洛的网》中夏洛第一次给威尔伯织的字是什么字?估计让很多家长一头雾水了吧?

此外,当科学家在构建模型时他们知道自己在做什么时,它们可以制造出更好的AI系统,来服务于依赖它们的人类。 在这些情况下,所谓的准确性与可解释性之间的权衡被证明是谬论:具有更多可解释性的模型通常变得更准确(而不是更少)。

但是在 2018 年 NeurIPS 大会上,在挤满了刚刚选择机器人代替外科医师的专家的会议室里,播音员继续对比赛进行实况描述。 FICO 提供了房屋净值信贷额度(HELOC)数据集,其中包含来自数千名匿名人的数据,包括其信用记录的各个方面以及该人是否拖欠贷款。 竞赛的目的是创建一个用于预测贷款违约的黑盒模型,然后解释黑盒。

在一些医疗领域以及可以改变生命决策的许多其他高风险机器学习应用中,似乎也没有体现黑盒模型准确性的优势(例如在 Caruana et al., 2015; Razavian et al., 2015; Rudin & Ustun, 2018 等论文中,作者都展示了具有可解释性条件的模型,这些模型的表现和不受约束的模型一样好)。

据了解,宾臣传媒集团始创于2002年,总部位于北京,发展至今已成为涵盖户外公交媒体运营、广播媒体事业、互联网经营、电子商务、活动策划与执行、展会设计与搭建、影视产品制作、投资管理等跨领域、多平台的传媒机构。

现场没有将可能并不需要作为黑盒模型的机器人作为一种选择,在座的的观众只能在准确的黑盒和不准确的透明盒子中进行选择。观众没有被告知手术结果的准确性是如何得出的(2%和15%分别测量的什么人群?),他们也没有被告知用于训练机器人的数据集的潜在缺陷。

另一幅图像则显示了只有在 2%的失败几率下才能执行手术的机器人,它其实是在模拟 AI 的黑盒方法。在这种情况下,他们需要完全信任机器人,不会对机器人提出任何问题,也不需要了解它是如何做出手术决定的。

在这一假设中,准确性必须以牺牲可以解释性(了解为什么外科医生要有做这些事情的能力)为代价。因此这项心理实验未能考虑到可解释性可能不会损坏准确性。而实际上,可解释性甚至可以提高准确性,因为它可以帮助你了解模型(机器人)何时可能是错误的。

比如说这道文言文《许仲平义不苟取》里边的一些词语理解让好多学生丢分,甚至很多学生这道题直接得零分。比如短文中的加点字理解要求解释三个字,1、尝:曾经,2、啖:吃,3、或:有人,还有让学生谈谈如何理解“梨无主,吾心独无主乎?”这句话的理解,应该理解为:梨虽然没有主人,但是我的内心难道没有主人吗?体现了题目的主旨:人心中应该有道义,不能随波逐流。

在掌舵人的感召和带领下,宾臣传媒在企业不断发展壮大的同时,也主动承担起更多的社会责任,践行公益,传播公益,也在企业行为中呈现常态化。

但是,正如“可解释机器学习挑战”所揭示的那样,实际上,在许多应用程序中,人们并不试图构造一个可解释的模型,因为他们可能认为对于复杂的数据集,可解释的模型不可能像黑盒那么精确。 或者,他们想将模型保留为专有模型。 然后,人们可能会考虑是否可以为计算机视觉和时间序列分析构建可解释的深度学习模型(e.g., Chen et al., 2019; Y. Li et al., 2017; O. Li et al., 2018; Ming et al., 2019),那么标准假设应是可解释模型不存在,改为它们存在的假设,然后直到证明它们不存在为止。

准确的黑盒和不太准确的透明模型之间的错误对立已经过火了。当成千上百的领先科学家和金融公司高管都被这种二分法所误导,请想象一下其他人是如何被愚弄。其影响是深远的:它影响到我们的刑事司法、金融、医疗系统以及许多其他领域的运作。

相反,黑盒模型可以掩盖无数潜在的严重错误(e.g., see Rudin, 2019)。即使在以深度神经中枢(最难解释的黑盒模型)为最先进技术的计算机视觉中,我们和其他科学家(e.g., Chen et al., 2019; Y. Li et al., 2017; L. Li, Liu, Chen, & Rudin, 2018; Ming, Xu, Qu, & Ren, 2019)已经找到了将可解释性条件添加到深度学习模型中的方法,从而使计算更加透明。即使对用于计算机视觉的深度神经网络,这些可解释性约束也不会以牺牲准确性为代价。

雷锋网原创文章,。详情见转载须知。

宾臣传媒董事长陈学文在接受采访时表示,未来,宾臣传媒将投入更多精力,充分调动和整合企业自有资源以及更广泛的社会资源,通过自身的引领和示范作用,以更加丰富多样的形式,更加积极、深入地参与到公益事业中去,为社会公益事业的发展,贡献更多力量。

也许,如果司法系统仅使用可解释的模型(我们和其他人已证明同样准确),那么 ProPublica 的记者将能够撰写不同的故事。例如,也许他们可能会写出这些分数的印刷错误是如何频繁发生的,而没有明显的方法来解决它们,导致司法系统中改变生活的决策意见不一致(see, e.g., Rudin et al.,  2019) 。

我们的团队决定,对于像信用评分这样重要的问题,我们不会为了解释就向评选团队提供黑盒。 取而代之的是,我们创建了一个即使没有任何数学基础的人也能够理解的可解释的模型,我们认为该模型可分解为不同的微型模型,每个微型模型都可以独立被理解。

那时,我们也不知如何是好了。我们是否应该遵守规则,给法官们一个黑盒,我们是否应该遵守规则使用黑盒模型并向裁判解释它?还是我们应该提供透明、可解释的模型?换句话说,当你发现自己被迫陷入机器人与外科医生的两难抉择时,你该怎么办?

可能有人认为,在许多应用程序中,可解释的模型可能不如黑盒模型那么准确。 毕竟,如果你可以建立一个准确的可解释模型,那么为什么还要使用黑盒呢?

我们需要坚持不将黑盒模型用于高风险决策,即除非根本无法构建能够达到相同准确性水平的可解释模型,否则我们不要将黑盒机器学习模型用于高风险决策。

四年级的一些小题注意是考察一些基础知识难道不算太大,但是一些拓展知识内容就比较难了。

四、AI 模型可兼得可解释性和准确性,只是尚未尝试而已

其他的一些小题就是考察学生的背诵和书写能力了,还有一些文言文,特别值得注意的就是文言文内容以后考试必备,而且还会增加考试比重,一直到高考都是重点内容,对于学生来说也是最难的地方。语文的学习范围比较广,需要学生掌握的知识也非常多,所以语文的学习在平时的积累很难在短期提高。

这是首个反映了这样一种需求的数据科学挑战赛:那些主导了基于机器学习的决策策略的黑盒模型所计算出来的成果,需要被梳理与消化。

在技术上可解释的模型与黑盒模型是等效的,但是可解释模型比黑盒模型更符合道德,两者间的不同:可解释模型被约束以更好地理解如何进行预测。

然后,主持人要求观众举手投票选择他们愿意进行哪种拯救生命的手术。除了一票以外,其他所有人都投票选择机器人。

例如,Angelino 等人在 2018 年曾在一项仅考虑人的年龄和犯罪历史的一些规则的研究中,创建了用于预测再次逮捕的机器学习模型。其完整的机器学习模型如下:如果此人有过三次以上的犯罪前科,或者18-20岁的男性,或者有两到三次犯罪记录的21-23岁男性,那么模型预计他们将在评估发生的两年时间内再次被逮捕,否则不会。

第二小题的考察词语也是让一些学生失分不少,特别是其中的“教师”和“教室”这两个词,因为读音十分相近也是平时经常遇到的词语,所以很多学生也是写错了。如果不看答案一些家长表示自己也容易马虎做错,有些普通话不好地地区更是容易出错。

三、黑盒模型可能会掩盖无数潜在的严重错误

尽管我们不一定提倡在刑事司法案件中使用这个该模型,但这套规则和黑盒模型(针对替代性模型的更正罪犯管理分析)一样准确,黑盒模型已经广泛合理使用于弗罗里达的布劳沃德县(Angelino et al., 2018)。

我们完全有可能构建一个可解释性与高准确性并存的 AI 模型——只是尚未尝试过而已。也许,如果我们这样做了,我们根本就不需要进行高风险决策。

一、首个对黑盒模型提出可解释性需求的挑战赛

此后,无论是公益教育宣传活动,还是助残扶贫一线,亦或是抗震抢险前线,都留下了陈学文的身影。

“2019年度公益传播奖”则旨在表彰为推动和传播公益事业发展并作出突出贡献的组织。向弘扬社会正能量、传递核心价值观的组织致敬。基于多年来对公益事业的广泛传播及积极参与,宾臣传媒荣获“2019年度公益传播奖”,这同时是公司连续两年获此殊荣。

为了解决人们对黑盒模型不透明的普遍担忧,一些科学家试图对黑盒模型做出解释,提出假设,解释它们为什么会做出这样的决定。这种解释通常试图使用一个完全不同的模型来模拟黑盒的预测(可能使用不同的重要变量,掩盖了黑盒可能正在做的事情),或者提供另一种统计,该统计信息提供了关于黑盒计算的不完整信息。这种解释是肤浅的,甚至是空洞的,因为它们夸大了黑盒的权威,而是认为黑盒是必要的。有时,这些解释是错误的。

 我们还为贷方和个人创建了一个额外的交互式在线可视化工具。在我们的网站上研究信用历史因素可以让人们了解哪些因素影响贷款申请决策,这种方式完全不需要黑盒。我们知道可能不会以这种方式赢得比赛,但我们需要提出更重要的事实。

“深耕公益,持续践行”成为宾臣传媒的重要企业文化之一。自学生时代起,陈学文便热衷慈善、公益活动。2002年,创办宾臣传媒之后,陈学文更是将个人的公益情怀延伸到了企业平台,利用企业优势把公益实践向更深广的领域拓展。企业成立之初,就利用自有媒体资源创建“北京公交车厢公益流动大课堂”项目,面向北京市民开展内涵丰富的公益宣传教育活动;在收获人生“第一桶金”100万企业利润时,便毅然将企业仅有的100万毫无保留地捐给了北京青少年禁毒教育基地。

有人认为,对于要求参赛者创建黑盒并进行解释的竞赛,问题实际上是必须有一个黑盒。但事实并非如此。早在 2018 年 7 月,当 Duke 团队收到数据时,并分析数据一周左右后,意识到可以在没有黑盒的情况下有效地分析 FICO 数据。

据悉,中国公益节设立于2011年,活动旨在弘扬公益精神,倡导公益行为,搭建多方深度对话、合作沟通的平台。历经九年的探索和实践,公益节已经成为极具影响力的年度公益盛事。

“2019年度公益人物奖”旨在表彰推动公益事业发展并作出突出贡献的个人。基于对公益事业的执着付出及突出贡献,陈学文荣获“2019年度公益人物奖”,这也是陈学文连续两年获得该奖项。

二、要实现可解释性就必须牺牲准确性吗?

无论是对线性模型使用深层神经网络还是经典统计技术,我们都发现这两种方法之间的准确性误差不到1%,1%的误差是在数据随机抽样误差范围之内。即使在使用提供了可解释的模型的机器学习技术时,其准确性也与最佳黑盒模型准确性相差不多。

在机器学习中,这些黑盒模型通过算法直接从数据中创建,这意味着人们,即使创造它们的人,也无法理解如何将变量组合在一起进行预测。即使一个人有一个可输入的变量列表,黑盒预测模型可以将其转为复杂的函数变量,以至于没有人可以理解变量之间是如何关联来达成最终的预测。

认为必须牺牲准确性来换取可解释性的观点是不正确的。当非常简单的可解释模型用于相同的任务时,它允许公司为高风险决策推销和出售私有或者复杂的黑盒模型。因此,模型创造者可以通过它来获利并且无需考虑对个人的有害影响。

宾臣传媒荣获“2019年度公益传播奖”

在某些情况下,我们可以很清楚地看到变量是如何联系起来形成最终的预测结果,最终的预测结果可能只是简短逻辑语句中的几个变量组合在一起,或者是使用线性模型将变量加权并相加在一起。

其实这些都是小学课外必读书目的内容,是考察学生的课文阅读量的内容,现在的素质教育不仅要求学生了解书本的内容,还有掌握大量的课文知识,即便是这样你想考100的满分也几乎是不可能的任务,不像数学和英语都有标准答案,一些家长还有考满分的可能,但是语文要想考满分是几乎不可能的事。

很少有人质疑这些模型,因为他们的设计师声称模型必须复杂才能准确。2018年的这场“可解释机器学习挑战赛”是一个案例研究,主旨在于考虑将黑盒模型与可解释模型进行权衡。

在宣布挑战赛获胜者之前,主持人要求听众(包括金融,机器人技术和机器学习领域的能者)进行思想实验,在该实验场景中,他们患有癌症,需要手术切除肿瘤。屏幕上显示了两张图像,一张图描述了一位人类外科医生,他可以解释有关手术的任何事情,但在手术过程中有15%的概率导致死亡。

在过去的几年中,计算机视觉领域深度学习的进步导致人们普遍认为:针对任何既定的数据科学问题,最准确的模型必须是复杂且无法解释的。

还有一些题目是考察学生的词汇量的,如果平时阅读量不高也会失分,比如第5小题也容易让很多学生出错。比如:填空什么()的肥料,好多学生写成了庄家的肥料,其实是考察学生的形容词汇,参考答案是充足的肥料。其实语文有时候没有标准答案,只要恰当就行,一般披卷老师看着能读顺就给对了。

上面的简单模型也许和许多其他最新的机器学习方法一样准确(Angelino et al., 2018)。在应用于其他数据集的许多不同类型的预测问题的机器学习方法中,也发现了相似的结果:可解释模型(研究中的小型线性模型或逻辑模型)的表现与更复杂的模型(黑盒)有相同的效果(Zeng et al., 2016)。似乎没有证据表明黑盒模型对犯罪风险预测会有所帮助。实际上,这些黑盒的缺点可能更明显,因为它们更难排查故障,更难信任和更难使用。

宾臣传媒董事长陈学文荣获“2019年度公益人物奖”

有时,可解释模型由放在一起的更简单模型组成(可分解),或者对模型施加新的约束条件,但是,大多数机器学习模型的设计没有可解释的约束条件,它们只是为了在静态数据集上为准确的预测变量而设计,它们可能代表也可能不代表模型在实践中的使用方式。

但是,当有人使用类似 COMPAS 非线性模型时,该模型不再依赖种族(Rudin, Wang, & Coker, 2019),仅对历史犯罪和年龄有依赖性。这是一个关于黑盒的错误解释如何导致失控的例子。

2018 年 12 月,在一年一度神经信息处理系统(NeurIPS)会议上,数百位顶级计算机科学家,金融工程师和高管在蒙特利尔会议中心的一个房间里,见证了一场由谷歌、Fair Isaac((FICO)与伯克利、牛津、帝国理工、加州大学欧文分校和麻省理工学院的学者合作举办的著名竞赛——“可解释性机器学习挑战赛”。

杜克大学副教授 Cynthia Rudin 、耶鲁大学副教授 Joanna Radin 基于首个对黑盒模型提出可解释性需求的挑战赛——“可解释性机器学习挑战赛”,对这一问题进行了思考,并发表在了哈佛数据科学计划与麻省理工学院出版社联合推出的刊物《哈佛数据科学评论(HDSR)》上。

信任黑盒模型意味着你不仅要信任模型的方程式,而且也要信任它所基于的整个数据库。例如,在机器人和外科医生的场景中,在不知道2%和15%是如何计算出来的情况下,我们应该针对特定亚群患者的数据之间的相关性持怀疑态度。

SHARE:
betway必威中文版 0 Replies to “河北累计承接京津转入基本单位9773个”