数据库数据太大爆内存该怎么办

数据库数据太大爆内存该怎么办，很多新手对此不是很清楚，为了帮助大家解决这个难题，下面小编将为大家详细讲解，有这方面需求的人可以来学习下，希望你能有所收获。

创新互联-专业网站定制、快速模板网站建设、高性价比冀州网站开发、企业建站全套包干低至880元,成熟完善的模板库,直接使用。一站式冀州网站制作公司更省心,省钱,快速模板网站建设找我们，业务覆盖冀州地区。费用合理售后完善，十载实体公司更值得信赖。

在研究、应用机器学习算法的经历中，相信大伙儿经常遇到数据集太大、内存不够用的情况。

这引出一系列问题：

怎么加载十几、几十 GB 的数据文件?
运行数据集的时候算法崩溃了，怎么办?
怎么处理内存不足导致的错误?

处理大型 ML 数据文件的七种思路

1. 分配更多内存

有的机器学习工具/库有默认内存设置，比如 Weka。这便是一个限制因素。

你需要检查一下：是否能重新设置该工具/库，分配更多内存。

对于 Weka，你可以在打开应用时，把内存当作一个参数进行调整。

2. 用更小的样本

你真的需要用到全部数据吗?

可以采集一个数据的随机样本，比如前 1,000 或 100,000 行。在全部数据上训练最终模型之前(使用渐进式的数据加载技巧)，先试着用这个小样本解决问题。

总的来说，对算法做快速地抽查、看到结果在前后的变化，在机器学习领域是一个很好的习惯。

你还可以考虑：相对于模型技巧，做一个数据大小的敏感性分析。或许，对于你的随机小样本，有一个天然的边际效应递减分水岭。越过这个关口，继续增加的数据规模带来的好处微乎其微。

3. 更多内存

你必须要用 PC 吗?

你可以考虑内存、性能高一个量级的计算设备。比如，租用 AWS 这样的云服务。租用云端有数十 GB 内存的机器，***价格每小时不到一美元。我个人觉得这是非常实际的选择。

4. 转换数据格式

你是否把数据存为原始的 ASCII 文本，比如 CSV 文件?

或许，使用其它格式能加速数据载入并且降低内存占用。好的选择包括像 GRIB、NetCDF、HDF 这样的二进制格式。

有很多命令行工具能帮你转换数据格式，而且不需要把整个数据集载入内存里。

换一种格式，可能帮助你以更紧凑的形式存储数据，节省内存空间;比如 2-byte 整数，或者 4-byte 浮点。

5. 流式处理数据，或渐进式的数据加载

你的所有数据，需要同时出现在内存里吗?

或许，你可以用代码或库，随时把需要的数据做流式处理或渐进式加载，导入内存里训练模型。

这可能需要算法使用优化技术迭代学习，比如使用随机梯度下降。那些需要内存里有所有数据、以进行矩阵运算的算法，比如某些对线性回归和逻辑回归的实现，就不适用了。

比如，Keras 深度学习 API 就提供了渐进式加载图像文件的功能，名为 flow_from_directory

另一个例子式 Pandas 库，可批量载入大型 CSV 文件。

6. 使用关系数据库(Relational database)

关系数据库为存储、访问大型数据集提供了标准化的方法。

在内部，数据存在硬盘中，能渐进式地 in batch 批量加载，并使用标准检索语言 SQL 检索。

像 MySQL、Postgres 这样的开源数据库工具，支持绝大多数的(全部?)编程语言。许多机器学习工具，都能直接与关系数据库连通。你也可以用 SQLite 这样更轻量的方法。

我发现，这种方法对大型表格式数据集非常有效率。

雷锋网提醒，你需要用能迭代学习的算法。

7. 使用大数据平台

有的情况下，你可能必须要使用大数据平台，即为处理超大型数据集而开发的平台。它们能让你进行数据转换，并在其上开发机器学习算法。

两个很好的例子是 Hadoop 与机器学习库 Mahout，以及 Spark 与 MLLib 库。

我认为，这是用尽上述办法仍无法解决的情况下，才需要采用的***手段。单纯是这为你的机器学习项目所带来的额外硬件、软件复杂情况，就会消耗许多精力。

即便如此，有的任务确实数据太过庞大，前面的选项都无法奏效。

看完上述内容是否对您有帮助呢？如果还想对相关知识有进一步的了解或阅读更多相关文章，请关注创新互联行业资讯频道，感谢您对创新互联的支持。

网站标题：数据库数据太大爆内存该怎么办
文章地址：http://lszwz.com/article/jhhsde.html

其他资讯

售后响应及时

7×24小时客服热线

数据备份

更安全、更高效、更稳定

价格公道精准

项目经理精准报价不弄虚作假

合作无风险

重合同讲信誉，无效全额退款

乐山小谭建站工作室是一家专注从事于高品质视觉体验及互联网设计开发，乐山网站建设，乐山网站设计，乐山网页设计，乐山网站制作，品牌网站建设，营销网站建设，集团网站建设，企业网站建设，外贸网站建设，响应式网站建设，小程序开发，微信开发，企业形象设计，企业宣传视频等服务，小谭建站位于乐山市龙岗区大运软件小镇，小谭建站拥有经验丰富的高级网站建设工程师和一流的网页高端设计人员，具备各种规模与类型网站建设的雄厚实力，在网站建设领域树立了自己独特的设计风格。

友情链接交换友情链接

邛崃做网站新网创想成都移动主机托管网页改版云主机专业网站建设成都网站制作百度推广公司特丽尔硅藻泥网站建设

Copyright © 2022 青羊区小谭信息技术咨询服务工作室乐山建站工作室 All Rights Reserved 蜀ICP备2021004003号-25

Copyright © 2022 青羊区小谭信息技术咨询服务工作室乐山建站工作室

蜀ICP备2021004003号-25