标签 Java面试题 下的文章

题目描述有 10 个文件,每个文件大小为 1G,每个文件的每一行存放的都是用户的 query,每个文件的 query 都可能重复。要求按照 query 的频度排序。解答思路如果 query 的重复度比较大,可以考虑一次性把所有 query 读入内存中处理;如果 query 的重复率不高,那么可用内存不足以容纳所有的 query,这时候就需要采用分治法或其他的方法来解决。方法一:HashMap 法

- 阅读剩余部分 -

题目描述从 5 亿个数中找出中位数。数据排序后,位置在最中间的数就是中位数。当样本数为奇数时,中位数为 第 (N+1)/2 个数;当样本数为偶数时,中位数为 第 N/2 个数与第 1+N/2 个数的均值。解答思路如果这道题没有内存大小限制,则可以把所有数读到内存中排序后找出中位数。但是最好的排序算法的时间复杂度都为 O(NlogN) 。这里使用其他方法。方法一:双堆法维护两个堆,一个大顶堆,一个小顶堆。大顶堆中最大的数小于等于小顶堆中最小的数;保证这两个堆中的元素个数的差不超过 1。

- 阅读剩余部分 -

对于海量数据到处理经常会涉及到 topK 问题。在设计数据结构和算法的时候,主要需要考虑的应该是当前算法(包括数据结构)跟给定情境(比如数据量级、数据类型)的适配程度,和当前问题最核心的瓶颈(如降低时间复杂度,还是降低空间复杂度)是什么。首先,我们来举几个常见的 topK 问题的例子:

- 阅读剩余部分 -

题目描述有 20 个数组,每个数组有 500 个元素,并且有序排列。如何在这 20*500 个数中找出前 500 的数?解答思路对于 TopK 问题,最常用的方法是使用堆排序。对本题而言,假设数组降序排列,可以采用以下方法:首先建立大顶堆,堆的大小为数组的个数,即为 20,把每个数组最大的值存到堆中。接着删除堆顶元素,保存到另一个大小为 500 的数组中,然后向大顶堆插入删除的元素所在数组的下一个元素。

- 阅读剩余部分 -

编程启蒙语言是 C 或 C++ 的同学都知道,字符串转换成整数是一道经典的编程题目,不仅能考察我们的编程知识,程序的健壮性也能反映出我们的编程功底。鸭哥组里有个妹子是 C++ 转 Java 开发的,平时工作非常认真,但有时候会钻牛角尖,因为不太了解 Java 一些工具类的妙用,想重复造轮子。昨天,因为工作中要将字符串转换为整数,妹子首先想的是自己写一个转换的工具类,但是搞了半天还是有问题,而且不敢保证程序的健壮性,所以向鸭哥求助。其实 Java 中是有现成的方法可以直接用的,我们一起来帮妹子看看吧~

- 阅读剩余部分 -

昨天鸭哥在微信群里,看到一个面试者诉苦,说自己面试时被提问权限修饰符的相关知识,要求说出 public、protected、default(无修饰符,即package private) 和 private 的区别? 结果他只能根据单词的字面意思说个大概,面试官的态度迅速就冷淡了。面试前,没能把握好这类基础知识,他追悔莫及。

- 阅读剩余部分 -

今天工作时,你的项目需要操作文件吗?一个程序运行时,变量、数组和对象中存储的数据都是存在于内存条中的,当程序运行结束,或者计算机断电时,它们就会消失。而现在的项目工程,往往涉及到大量需要长时间保存的数据,而磁盘文件能够永久保存数据,所以数据处理和文件操作知识就密切相关了。掌握文件操作,能够大大提高我们对数据的处理能力。所以今天鸭哥想和大家一起,聊聊文件操作那些事儿~

- 阅读剩余部分 -