Elasticsearch 架构以及源码概览
设计高并发下的读服务
Java最佳实践
Java Top 100热门问答(Stackoverflow)

Elasticsearch 架构以及源码概览

Elasticsearch 是最近两年异军突起的一个兼有搜索引擎和NoSQL数据库功能的开源系统,基于Java/Lucene构建。最近研究了一下,感觉 Elasticsearch 的架构以及其开源的生态构建都有许多可借鉴之处,所以整理成文章分享下。本文的代码以及架构分析主要基于 Elasticsearch 2.X 最新稳定版。 Elasticsearch 看名字就能大概了解……

设计高并发下的读服务

本文作者是一个一线的电商老兵,任职于京东商城。在本文中,他将会分享他在构建以读为主的系统时总结的经验和教训,内容包括使用HTTP协议对外通讯、使用短连接、数据异构、巧用缓存、流量控制、防刷、降级、多域名等,作者老马不带遮掩的,把自己总结的经验,包括代码都放到这里了,欢迎各位检阅! 几乎所有的互联网系统……

Java最佳实践

Java 是在世界各地最流行的编程语言之一, 但是看起来没人喜欢使用它。而 Java 事实上还算是一门不错的语言,随着 Java 8 最近的问世,我决定编制一个库,实践和工具的清单,汇集 Java 的一些最佳实践。 本文被放到了 Github 上。你可以随意地提交贡献,并加入自己的有关 Java 方面的建议和最佳实践。 本文概览: 风格 ……

Java Top 100热门问答(Stackoverflow)

目录 基础语法 Java += 操作符实质 将InputStream转换为String 将数组转换为List 如何遍历map对象 public,protected,private,不加修饰符。有什么区别呢? 如何测试一个数组是否包含指定的值? 重写(Override)equlas和hashCode方法时应考虑的问题 从一个多层嵌套循环中直接跳出 如何将String转换为Int 如何分割(s……

  • Java8 简明教程

    Java并没有没落,人们开始认识到这一点 欢迎阅读我编写的Java 8介绍。本教程将带领你一步步认识这门语言的所有新特性。通过简单明了的代码示例,你将会学习到如何使用默认接口方法,Lambda表达式,方法引用和可重复注解。在这篇教程的最后,你还将对最新推出的API有一定的了解,例如:流控制,函数式接口,map扩展和新的时间日期API等等。 没有大段的废话,只是一些带注释的代码片段,望君喜欢。 接口中的默认方法 Java 8 允许我们使用default关键字,为接口添加非抽象(non-abstract)的方法实现。这个特性又被称为扩展方法。下面是我们……
  • 培训机构毕业的程序员被歧视的背后逻辑

    现在,像达内、华清远见、国嵌、北大青鸟、传播智客等等IT培训机构很多,为尚未毕业的大学生、毕业了一时找不到工作的大学生、工作后想转行的再就业者提供了一个掌握新技能的机会,通过三个月或半年或更久的培训,你就可以掌握某一种技能,比如Android开发、Java Web开发、iOS开发、嵌入式Linux开发,然后,没然后了吗…… Sorry,然后还是有的,只不过,“然后”并不是像培训机构的销售代表频频给你通电话时宣传的那样光明罢了。有的机构会推荐你就业直到你彻底失望他们推荐的单位,有的机构会放你出去闯荡江湖四处碰壁……形式不一,但,一……
  • 我所理解的大数据个性化推荐

    一、写在之前的题外话 缘起。 想起要写这篇文章,一方面是昨天终于把项亮写的《推荐系统实践》给看完了,另一方面是自己负责的推荐系统项目已经处于一个多版本迭代的阶段了,并且从最近的AB测试效果来看,新提交的算法模型还是有一定的进步的,如今已经把流量全部切换到了新算法中。 所以,结合看书的一些思考,以及实际操作的一些感想,总是有一些想要表达、分享的东西,不吐不快啊~~ 哈哈! 不过在说个性化推荐之前,说两个题外话。 首先就是关于看书这个话题,我在《这些年,这些挖掘机算法,这些反思》一文中,曾经说到。看书是提升……
  • code123
    Python奇技淫巧

    Python奇技淫巧

    显示有限的接口到外部 当发布python第三方package时, 并不希望代码中所有的函数或者class可以被外部import, 在__init__.py中添加__all__……
  • code123
    编程的智慧

    编程的智慧

    编程是一件创造性的工作,是一门艺术。精通任何一门艺术,都需要很多的练习和领悟,所以这里提出的“智慧”,并不是号称三天瘦二十斤的减肥……
  • 编程的宗派

    总是有人喜欢争论这类问题,到底是“函数式编程”(FP)好,还是“面向对象编程”(OOP)好。既然出了两个帮派,就有人积极地做它们的帮众,互相唾骂和鄙视。然后呢又出了一个“好好先生帮”,这个帮的人喜欢说,管它什么范式呢,能解决问题的工具就是好工具!我个人其实不属于这三帮人中的任何一个。 面向对象编程(Object-Oriented Programming) 如果你看透了表面现象就会发现,其实“面向对象编程”本身没有引入很多新东西。所谓“面向对象语言”,其实就是经典的“过程式语言”(比如Pascal),加上一点抽象能力。所谓“类”和“对象”,基本是过程……
  • code123
    怎样尊重一个程序员

    怎样尊重一个程序员

    得知一位久违的同学来到了旧金山湾区,然而我见到他时,这人正处于一生中最痛苦的时期。他告诉我,自己任职的公司在他加入之前和之后,判……
  • code123
    Spark容错机制

    Spark容错机制

    引入 一般来说,分布式数据集的容错性有两种方式:数据检查点和记录数据的更新。 面向大规模数据分析,数据检查点操作成本很高,需要通过……
  • code123
    爬虫入门讲解:基础理论篇

    爬虫入门讲解:基础理论篇

    关于爬虫内容的分享,我会分成两篇,六个部分来分享,分别是: 我们的目的是什么 内容从何而来 了解网络请求 一些常见的限制方式 尝试解……
  • Linux命令行的艺术

    熟练使用命令行是一种常常被忽视或被认为难以掌握的技能,但实际上,它可以提高你作为工程师的灵活性以及生产力。本文是一份我在 Linux 上工作时发现的一些关于命令行的使用的小技巧的摘要。有些小技巧是非常基础的,而另外一些则是相当复杂的甚至晦涩难懂的。这篇文章并不长,但当你能够熟练掌握这里列出的所有技巧时,你就学会了很多关于命令行的东西了。 必读 涵盖范围: 这篇文章对刚接触命令行的新手以及具有命令行使用经验的人都有用处。本文致力于做到覆盖面广(尽量包括一切重要的内容),具体(给出最常见的具体的例子)以及……
  • tornado异步请求

    Python的web框架五花八门.大而全的框架Django,小巧的框架如web.py,flask等.以异步著称的tornado等等. 这里记录一下tornado编写异步请求程序的例子. 首先要知道,要想整个web服务是异步的,前提条件是你的各个耗时操作是异步的才行.如果你的操作是一个sleep(),由于tornado本身是单进程单线程的,那么你整个进程就被sleep()阻塞了. 一个典型的tornado异步方法编写如下: class Index(RequestHandler): @coroutine def get(self): response = yield AsyncHTTPClient().fetch('http://google.com') ……
  • 我为什么要在总理来的第二天离开创业大街

    一 总理上次来到创业街,是四个月,要不就是五个月前了。 之后,全国创业形势一路走红,锣鼓喧天鞭炮齐鸣。大众创业万众创新,颇有大炼钢铁亩产万斤之势,尤其在媒体上。 再之后,2015 进入下半年,风投圈的大佬们逐个跳出来说,冬天来了,我们不能再给创业企业那么高的估值了。 言下之意,创业者们磨磨嘴皮子就能从老子手里骗几千万的日子一去不复返了。今后的融资数额,对比 2014 到 2015 上半年——我们也不过分——去零除二刚刚好:原来 2000 万的,现在 100 万;原来 200 万的,趁早回家玩蛋。 噫,总理的面子就值一个月的?这令我很不……
  • 如果你做的事情毫不费力,就是在浪费时间

    注:本文作者 Heidi Roizen 系 DFJ Venture 合伙人,曾任苹果公司主管开发者关系的高级副总裁,女性创业者。 Heidi Roizen女士一度是硅谷人人争相学习的典范。她曾创办自己的公司并管理了 14 年之久。后来,她担任苹果公司主管开发者关系的高级副总裁。现在,她是 DFJ Venture 的一位风投家,她还在斯坦福主讲一门名叫“企业家精神”的课程。她几乎认识硅谷的所有重要人物并且灵活地运用着自己的影响力。哈佛商学院甚至还有专门关于她的案例。 以下是 Roizen 提出的八条原则,她正是利用这些原则来指导自己的工作、建立起广泛的人际网络并……
  • 淘宝搜索算法现状

    淘宝搜索排序的目的是帮助用户快速的找到需要的商品。从技术上来说,就是在用户输入关键词匹配到的商品中,把最符合用户需求的商品排到第一位,其它的依次排在后续相应的位置。为了更好的实现这个目标,算法排序系统基本按三个方面来推进: 一、算法模型 当用户输入关键词进行搜索的时候,系统依据算法模型来给匹配到的每个商品进行实时的计算,并按照分数的大小对商品进行排序。 对于好的算法模型,首先需要考虑我们能够有哪些特征因子可以应用。比如在网页搜索中,算法模型基本就是按网页的重要性和相关性给网页计算一个分数,然后……
  • 推荐系统的那点事

    推荐系统的误区 回想起来,我也算是国内接触推荐系统较早的人之一了,最近和人聊天,觉得不少人对推荐系统有所误解,以为需要多么高大上的算法才能搭建起来的,我只想说我经常说的那句话【不是这样的】,所以有了这篇文章。 第一次接触【推荐系统】是在两年前在某高校的互联网信息处理实验室的时候,那时候,【机器学习】和【大数据】都是新概念,但是差不多半年后,【大数据】的概念就开始风靡全球了,到现在已经被爆炒得面目全非。 那年还因此买了一本项亮的书《推荐系统实践》,那本书和现在的很多热门书籍一样,都是跟着概念热起来……