阿里云 EMR Serverless Spark 在微财机器学习场景下的应用
作者:微财技术研发经理 宋鑫 微财介绍 微财是一家创新型的金融科技企业,凭借多年积累的金融科技能力和数据处理优势,为客户提供消费分期等金融信息服务,致力于成为值得信赖的金融机构合作伙伴。旗下拥有好分期等品牌,为高成长用户提供信用分期借款过程中的综合性信息、技术以及辅助服务。 业务挑战 数据资源是金融科技企业的核心价值,微财依托大数据评估用户借款...

你好 用机器学习PAI的emr上的ds集群读hive可以读取我现有hadoop集群的hive数据吗?
你好 用机器学习PAI的emr上的ds集群读hive可以读取我现有hadoop集群的hive数据吗?另外,训练也是在pai-dls上进行吗?(还是ds上训练)
S3中的压缩数据需要用于EMR或Redshift上的机器学习
我在S3存储中有压缩格式的巨大CSV文件。我只需要数据中的一部分列用于机器学习目的。如何在不传输整个文件的情况下将这些列提取到EMR然后再提取到Redshift?我的想法是将所有文件处理成EMR,然后提取子集并将所需的列推送到Redshift。但这需要花费很多时间。如果有优化的方法来处理这些数据,请告诉我。
超大规模机器学习在EMR的实践
新浪微博高级算法工程师 张拓宇在2017杭州云栖大会中做了题为《超大规模机器学习在EMR的实践》的分享。 https://yq.aliyun.com/download/1119?spm=a2c4e.11154804.0.0.8d146a79RwoMhO
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。