您现在的位置: 主页 > 翡翠社区 >

翡翠社区

DataVisor维择科技帮助保护数据隐私同时实现数据智能

  近日,全球知名科技媒体VentureBeat上发表了题为《数据隐私和数据智能可以共存吗?》一文,文章作者DataVisor维择科技创始人兼CEO谢映莲阐释了运用无监督机器学习引擎,可以利用更少的数据获得更多的智能的观点,来看看她具体怎么说。

  我们应当改变处理客户数据的方式:当前数据采集“越多越好”的理念需要改变,而是思考如何仅收集必要的最少量数据还能保持智能化。在商业环境中,95后女孩为什么要辞职?!数据常常被认为是实现商务成功的最重要资源之一,减少数据采集听起来可能违反正常观念,但是,这正是企业需要做出的改变。事实上收集更少的数据并不像听起来那么令人担忧。

  当今商业环境中普遍认为,系统收集分析的数据越多,它们将越智能。事实并非如此,“更少的数据意味着更少的智能”这样的观点是不正确的。当普遍认为更多数据是业务竞争差异化的优势时,实际上激励了企业寻求新的和更多的收集数据的方法,但这很可能会造成不良影响。

  我们每天都会看到有关数据泄漏、暴露、网络漏洞等信息,我们也常常听到有关身份盗窃和金融欺诈的可怕事件,目睹由于无法保护收集的数据而遭受企业声誉损害的情况。不少企业因此遭受到监管惩罚或者消费者的强烈抵制。

  隐私问题只是数据收集所带来的弊端之一。大规模数据采集和管理还涉及成本问题:计算成本,存储成本,数据传输成本等等。我们正处于大数据、人工智能和机器学习的时代,但是,如果数据量继续等同于系统的智能性,这些成本将继续飙升。

  当今的企业希望最大化了解客户的一切。但是,客户对他们的每一个举动都受到监视、记录、处理、分析的想法感到畏惧。企业收集的数据越多,客户的畏惧就越大,当客户数据被盗时,除罪犯外的包括企业和客户在内的每个人都会因此感到恐慌。如果我们对收集的数据以及如何处理和分析数据更加了解的话,我们事实上是可以不需要那样大量的数据的。

  最关键的步骤是从收集和依赖用户个体数据项转移到处理和分析聚合类的数据。例如,我们可以查看IP地址前缀,而不是分析单个IP地址。这样的分析依然可以获取所需的智能信息。这种方法的优势在于,我们对聚合数据处理的能力越强,对个人用户信息的收集需求就越少。尽管这可能看起来很矛盾,全球领先技术科大讯飞翻译机30到货热卖,但事实是,我们用更少的数据得到了更多的智能。当我们进行特征工程(构建高级模型的关键部分)时,我们也可以基于聚类数据创建特征。例如,在分析用户交易时,我们可以对交易金额超过一些预定值的交易,收集计算其在一段时间内的总交易量,而不需要精确地收集单个交易金额。

  此外,通过群组级数据的整体分析,我们可以发现许多个体审查时无法发现的模式或趋势。这使我们能够收集合理量级的数据并输出有价值的见解,不必深入研究个体数据。这种情况下,对个体数据的需求减少,而整体智能性提高了。这种群组级分析的派生数据增加了另一层好处,即我们可以从一个数据点得到许多附加的特征,这些特征能够帮我们进一步完善结果。例如,我们可以查看用户交易的IP地址范围以区分正常和异常的移动模式,这样我们就可以判断单个用户是否正在旅行,而无需了解用户航班和酒店等详细信息。

  使用这类群组分析的方法具有很大的意义,意味着技术与数据隐私和价值观能保持一致。我们可以从群组数据中获得的洞见越多,对单个用户的隐私数据需求就越少。无监督机器学习(UML)正是这类方法中的技术之一。

  如果没有无监督机器学习(UML)这一类的方法,我们就只能利用增加个体数据来更好预测该用户的未来行为。我们必须对每一个用户进行大量的数据收集。而使用UML,我们可以在群组级别分析用户,并从用户的相关性和相似性中获得更多智能。最终,我们对个体用户数据的需求会降低,同时我们可以预测该群组的未来行为。

  在我所从事的反欺诈领域,提前预警的能力是我们成功的关键。为了确保用户免受欺诈损失,我们必须能够提前检测到快速发展且变化的攻击。为了实现这一目标,我们对数据并进行整体群组性的分析,以发现异常可疑活动的相关性和相似性,这些相关性和相似性指向了欺诈行为和恶意帐户。我们的UML引擎仅使用少量数据就做到了这一点。我们还发现,许多企业已经拥有检测欺诈所需的很多数据,但并没有有效地挖掘数据价值。

  全球监管领域的发展表明,我们正朝着保护用户隐私和提升透明度的方向发展。同时,数据收集的限制条件也越来越严格。但这并不意味着我们的数据智能会下降。通过分析聚类型和群组型的数据,运用先进的AI和无监督机器学习技术等,我们可以在保持用户隐私的同时获得更高的智能。

  随着当下数据采集和管理要求的转变,与有监督的机器学习(SML)相比,无监督机器学习(UML)的价值正在迅速提升。尽管SML在数据丰富的环境中具有一定意义,但其有效性的提升往往基于给算法提供更多、更详细的描述个体的数据,这种不受限制的数据采集频率可能会带来严重的问题。相反,使用UML,我们可以改变这种趋势,因为我们减少了个人信息的获取,隐私保护能力的提升也就立竿见影。当SML的标签数据出现偏差时,UML也具有明显的优势,因为UML是客观的,它仅根据非标签数据去自动挖掘发现未知的模式和规律,这使我们能够发掘传统方法(如SML)所无法检测的新型欺诈模式。

  目前银行业和支付行业正在积极利用新技术新功能,不少金融服务提供商也逐渐了解到了UML带来的价值。一直以来,数据收集的隐私问题“如何提升平台的安全性并加强对用户的身份验证”是平台与客户摩擦加剧的因素。借助UML,这些企业或平台能够优化用户体验,而不会增加不必要的摩擦。在当今数字经济中,金融机构必须在风险管理、客户体验、数据隐私的价值观之间取得平衡,这一点至关重要。

  今天,我们站在一个新时代的大门前,在这个时代,大数据隐私和数据智能已不必再相互排斥。


六合财富高手坛| 最快手机现场开奖直播| 雷锋高手一坛雷锋论坛| 香港财神资料网站| 天天团队心水刘伯温| 特马神算网香港赛马会| 平码三中三公式规律| 香港马会资料开奖结果| 广东鹰坛老牌图库| 守护幸福六肖中特精品平肖|