设为首页收藏本站Access中国

Office中国论坛/Access中国论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

返回列表 发新帖
查看: 1628|回复: 2
打印 上一主题 下一主题

[窗体] 关于大乐透开奖数据采集的问题请教?

[复制链接]

点击这里给我发消息

跳转到指定楼层
1#
发表于 2018-10-4 17:06:32 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 真主 于 2018-10-5 10:45 编辑

(见2楼)如下图所示,通过网页将开奖数据采集下来了,结果发现我采集的数据根本没用,没法追加到“大乐透”表中去,请各位提点,谢谢!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 分享分享 分享淘帖 订阅订阅

点击这里给我发消息

2#
 楼主| 发表于 2018-10-5 10:54:00 | 只看该作者
已更新,目前能自动下载部份数据,且能自动更新到数据表中
但金额及中奖数无法更新,用的正则表达式处理,但数位长短不一致的,我还没搞懂怎样用正则表达式处理
  1. >(\d{5})[\s\S]*?(\d{2})[\s\S]*?(\d{2})[\s\S]*?(\d{2})[\s\S]*?(\d{2})[\s\S]*?(\d{2})[\s\S]*?(\d{2})[\s\S]*?(\d{2})[\s\S]*?([\d\-]{10})[\s\S]*?
复制代码




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
3#
发表于 2018-10-9 10:59:41 | 只看该作者
\d{1,8}。
不过奖金是含有千分分隔号的,建议先把千分分隔号(逗号)替换掉再处理。
另一种思路是先把tr匹配成分组,再匹配td为分组,用ado进行addnew处理。感觉正则表达式处理表格并不简单。
如果使用VBA的话,我可能会用webbrowser+DOM,用getElemenstByTag或者table集合中的tablerow和tablecol来处理。可能我对选择器比较熟悉吧。
PS:真相是,我会考虑用Python+BeautifulSoup来处理的
您需要登录后才可以回帖 登录 | 注册

本版积分规则

QQ|站长邮箱|小黑屋|手机版|Office中国/Access中国 ( 粤ICP备10043721号-1 )  

GMT+8, 2024-4-24 13:54 , Processed in 0.136999 second(s), 27 queries .

Powered by Discuz! X3.3

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表