InfoQ 中文

InfoQ 源

Latest articles

严选埋点质量保障体系建设

梁策 田晓旭 发布于:2020 年 9 月 25 日 02:41 七牛云 CEO 许式伟,首次分享完整架构经验,带你解读常见业务场景的架构范式,戳此学习 >> 随着业务的高速发展,对于精细化流量运营的需求不断提升,埋点量级也在不断提升,埋点数据的质量问题是绕不过去的一个点。我们主要围绕“埋点管理”(定义管理和流程控制)、“埋点线下保障”、“埋点线上保障”这三个环节展开。改造流程、优化策略,打造相应的工具平台来固化流程和辅助测试,保障埋点开发正确性的同时,也提高协作效率。 随着业务的高速发展,对于精细化流量运营的需求不断提升,埋点量级也在不断提升,埋点数据的质量问题是绕不过去的一个点,但埋点质量保障又是个老大难问题: 首先,由于埋点是非结构化的数据,不像数据库本身对结构化数据的结构由系统的保障;...

企业究竟该如何构建数据模型?

天启 刘燕 发布于:2020 年 9 月 25 日 02:30 模型没有对错之分,只有适合的业务场景之分。数据模型能够促进业务与技术进行有效沟通。只要基于数据进行决策及拓展业务边界,好的数据模型必不可少。那么,企业究竟该如何构建数据模型呢?数据中台能解决什么问题?我们用四个字总结:全、统、通、用。全:数据中台和数据仓库的区别,数据仓库是满足业务需求或业务主题的;而数据中台是一个大而全的概念,为企业提供战略性的数据中台服务。数据应收尽收,所有能沉淀到数据中台的数据都收集到数据中台,包括增量、全量、实时、离线的数据。统:统一数据标准规范。从数据质量标准、安全标准、模型规范、开发规范统一起来形成数据资产。通:打通人的身份 ID、商品 ID、媒介 ID,消除数据孤岛。用:体现在数据服务,用起来会有流共享、批共享及其他共享。总结起来:「全」是基础;「统和通」是途径;「用」是最终目的,最高境界是数据驱动业务创新和变革。数据中台...

数据科学家应该了解的最佳软件工程实践

Kurtis Pykes 刘志勇 李冬梅 发布于:2020 年 9 月 25 日 02:20 本文最初发表在 Towards Data Science 博客,经原作者 Kurtis Pykes 授权,InfoQ 中文站翻译并分享。 我一直与朋友们热切地研究并尝试一些能使我成为更好的数据科学家的方法。如果不与那些帮助过我的人们分享目前的情况,我是不可能在事业上取得进步的。 最近,我在 LinkedIn 上进行了一次民意调查,我惊讶地发现,很多人持有这样的观点:数据科学家必须懂得编程标准并遵循工程最佳实践。投票结果许多数据科学家(包括我自己)都缺乏基本的统计学知识,对统计学的应用知之甚少。而数学家们认为,在应用之前,必须对应用于各种场景的原理有一个坚实的理解,我承认我并不了解这些原理。软件工程师希望数据科学家能够在遵循基本编程原则的同时进行实验。最让我感到刺痛的是,每一位“赞成”的投票者目前都在担任数据科学家,而且其中许多人还担任领导角色(在投票时)——包括...

Android端代码染色原理及技术实践

高德技术 发布于:2020 年 9 月 25 日 02:10 导读高德地图开放平台产品不断迭代,代码逻辑越来越复杂,现有的测试流程不能保证完全覆盖所有业务代码,测试不到的代码及分支,会存在一定的风险。为了保证测试全面覆盖,需要引入代码覆盖率做为测试指标,需要对 SDK 代码进行染色,测试结束后可生成代码覆盖率报告,作为发版前的一项重要卡点指标。本文小结了 Android 端代码染色原理及技术实践。 相关阅读: iOS 代码染色原理及技术实践 JaCoCo 工具JaCoCo 有以下优点: 支持 Ant 和 Gradle 打包方式,可以自由切换。 支持离线模式,更贴合 SDK 的使用场景。 JaCoCo 文档比较全面,还在持续维护,有问题便于解决。 JaCoCo 主要是通过...

Let’s Encrypt实践指北

ThoughtWorks洞见 发布于:2020 年 9 月 25 日 02:04 资深架构师 杨波,正在以案例项目驱动,原理+编程技术+工具结合落地微服务和云原生架构,立即查看 >> 最近刚好有个项目需要配置 HTTPS,也购买了域名,尤其在知道了本文要介绍的“神器” —— Let’s Encrypt 之后,大大简化了学习成本和时间。 初衷一直以来,对于 HTTPS 证书的概念都有些含糊不清,似懂非懂。原因是自己之前比较懒,对于一些需要前置条件(买域名买证书等)才能玩的东西总是积极不起来(对!一定是穷)。而最近刚好有个项目需要配置 HTTPS,也购买了域名(实践时自己还是买了域名),尤其在知道了本文要介绍的“神器” —— Let’s Encrypt 之后,大大简化了学习成本和时间。趁着一些碎片化的时间,研究了证书的一些基本概念以及使用方法,总结下来,以供参考。另外,在我查找一些相关文档的过程中发现一个问题,就是由于这方面知识的时效性很差,出现很多信息不对等的情况,索性我将参考过的所有官网文档链接贴在了最后,方便大家在看到这篇文章时,根据链接查看最新官方支持情况。(...

为什么卷积神经网络优于传统机器学习算法?

Rade Nježić 刘志勇 刘燕 发布于:2020 年 9 月 25 日 00:10 本文最初发表于 Towards Data Science 博客,经原作者 Rade Nježić 授权,InfoQ 中文站翻译并分享。 近十年来,随着深度学习的发现,图像分类领域经历了复兴。传统的机器学习方法已被更新的、更强大的深度学习算法所取代,例如卷积神经网络。然而,要真正理解并欣赏深度学习,我们必须知道为什么其他方法失败了,而深度学习却成功了。在本文中,我将试图通过对 Fashion MNIST 数据集应用不同的分类算法来回答其中一些问题。 数据集信息Fashion MNIST 是由 Zalando Fashion 研究室于 2017 年 8 月推出的。随着 MNIST 变得过于容易和过度使用,Fashion...

同步与异步Python有何不同?

Miguel Grinberg 张健欣 万佳 发布于:2020 年 9 月 25 日 00:00 你是否听到人们说过,异步 Python 代码比“普通(或同步)Python 代码更快?果真是那样吗?“同步”和“异步”是什么意思?Web 应用程序通常要处理许多请求,这些请求在很短的时间段内来自不同的客户端。为避免处理延迟,必须考虑并行处理多个请求,这通常称为“并发”。在本文中,我将继续使用 Web 应用程序作为例子,但是要记住还有其它类型的应用程序也从并发完成多个任务中获益,因此这个讨论并不仅仅是针对 Web 应用程序的。术语“同步”和“异步”指的是编写并发应用程序的两种方式。所谓的“同步”服务器使用底层操作系统支持的线程和进程来实现这种并发性。下面是同步部署的一个示意图:在这种情况下,我们有...

Flutter 完成全平台制霸:实现 Windows 应用支持

李俊辰王强 发布于:2020 年 9 月 25 日 00:00 Flutter 作为跨平台开发利器,一经推出便在业内赢得了不错的口碑。Flutter 最初是应用于 iOS 和 Android 应用开发的,后扩展到了 Web、macOS 和 Linux,现如今也可以开发 Windows 应用了,补齐了全平台的最后一块拼图。 Flutter 作为谷歌出品的 UI 框架,凭借“多端一致”和“渲染性能”两方面的优势,深受广大开发者的推崇。谷歌曾表示 Flutter 的目标是提供一个可移植的框架,从而在各种平台上都能构建以原生速度运行的 UI。这也意味着,在谷歌眼中,Flutter 不止于跨平台开发,而是全平台制霸。今年 7 月 8 日谷歌发布了 Flutter 在 Linux 上的第一个...

实战贴:如何使用机器学习检测欺诈?

Kurtis Pykes 刘志勇 刘燕 发布于:2020 年 9 月 25 日 00:00 本文最初发表于 Towards Data Science 博客,经原作者 Kurtis Pykes 授权,InfoQ 中文站翻译并分享。机器学习是人工智能的一个子集,它赋予了系统从经验中自动学习和改进的能力,无需进行显式编程。如此说来,我们(人类)已经可以向计算机提供大量的数据集,让计算机学习模式,这样它在面对一个或多个新实例时,能够学习如何作出决定——当我发现这一见解时,我立即知道世界即将发生改变。 报告显示,欺诈行为给全球经济造成了 3.89 万亿英镑的损失,在过去十年里损失上升了 56%。 ——Crowe UK 作为欺诈行为的受害者,我萌生了防止这种情况再次发生在我(以及其他任何人)身上的想法,这促使我开始思考一个与我所习惯的完全不同的领域。欺诈检测问题在机器学习术语中,诸如欺诈检测之类的问题,可以被归类为分类问题,其目标是预测离散标签...

Netflix推荐系统如何推动业务增长?

(error)

Discover, share and read the best on the web

Subscribe to RSS Feeds, Blogs, Podcasts, Twitter searches, Facebook pages, even Email Newsletters! Get unfiltered news feeds or filter them to your liking.

Get Inoreader
Inoreader - Subscribe to RSS Feeds, Blogs, Podcasts, Twitter searches, Facebook pages, even Email Newsletters!