2012-06-30
WAP PUSH业务是承载在SMS业务之上的,亦即WAP PUSH数据封装在SMS PDU的UserData中。本文分析PDU的UserData中WAP PUSH的WSP和WBXML的编码。
本文以《WAP PUSH解析(1)——SMS PDU编码》中已经讲解了SMS PDU封装的WAP PUSH数据为例来讲解WSP和WBXML的编码。SMS PDU封装在WSP和WBXML外面,所以WSP和WBXML的编码是不考虑数据是否是拼接的长短信的,WSP和WBXML要解析的是SMS PDU(如果分多个SMS发送,这里是拼接后的)的完整UserData。
79 06 01 ae 02056a0045c6080c03662e31303038362e636e2f662f736a6678000103e689bee69c8be5
8f8be38081e69fa5e5a4a9e6b094e38081e79c8be5b08fe8afb4e38081e79c8be696b0e997bbe280
a6e6898be69cbae9a39ee4bfa1efbc8ce7ae80e58d95e4bda0e79a84e7949fe6b4bbefbc81e8b5b6
e5bfabe4b88be8bdbde4bd93e9aa8ce6898be69cbae9a39ee4bfa1000101
一、WSP
下面是按次解析的WSP封装
1. transactionId:
0x79
2. pduType: 06
06 PDU_TYPE_PUSH
07 PDU_TYPE_CONFIRMED_PUSH
3. headerLength:
头长度是变长的:32bits标示的7位编码,最多用5个octets编码
octet的bit7为1标识后续octet仍为长度数据;为0标识长度结束
所以,这里01也就是头的长度。
4. ContentType:
(wap-230-wsp-20010705-a section 8.4.2.24)
WAP PUSH是通常的说法,其实WAP PUSH并不是最终的业务,最终业务是ContentType中标识的业务。
ae & 0x80 -> 2E
0x2e CONTENT_TYPE_B_PUSH_SI "application/vnd.wap.sic"
0x30 CONTENT_TYPE_B_PUSH_SL "application/vnd.wap.slc"
0x32 CONTENT_TYPE_B_PUSH_CO "application/vnd.wap.coc"
0x3e CONTENT_TYPE_B_MMS "application/vnd.wap.mms-message"
0x44 CONTENT_TYPE_B_PUSH_SYNCML_NOTI "application/vnd.syncml.notification"
可以看到,PUSH Service Indication(SI) / PUSH Sservice Load(SL) / MMS都是WAP PUSH over SMS中的业务,而通常说的WAP PUSH业务指的是SI/SL。
这里封装的是SI。
接下来是WBXML封装的SI数据。
02056a 00 45c6 08 0c 03662e31303038362e636e2f662f736a6678000103e689bee69c8be58f8be380
81e69fa5e5a4a9e6b094e38081e79c8be5b08fe8afb4e38081e79c8be696b0e997bbe280a6e6898b
e69cbae9a39ee4bfa1efbc8ce7ae80e58d95e4bda0e79a84e7949fe6b4bbefbc81e8b5b6e5bfabe4
b88be8bdbde4bd93e9aa8ce6898be69cbae9a39ee4bfa100 0101
二、PUSH SI的封装WBXML
WAP PUSH SI是封装在XML格式中的,但是XML不适合在SMS这种长度极度受限的传输手段,所以采用PUSH采用WBXML(WAP Binary XML)封装。WBXML用一个字节代替常用的TAG和Attribute,所以能极大的节约传输数据量。
下面是WBXML到XML的解析:
02 <?xml version="1.0" encoding="UTF-8"?>
05 <!DOCTYPE si PUBLIC "-//WAPFORUM//DTD SI 1.0//EN"
"http://www.wapforum.org/DTD/si.dtd">
6A IANACharset
04 iso-8859-1
17 shift_JIS
6A UTF-8
03 US-ASCII
00 String table Length
45 <si>
C6 <indication
08 action="signal-high"
06 action="signal-low"
07 action="signal-medium"
0C href="http://
0D href="http://www.
0E href="https://
0F href="https://www.
03 start of inline string value
662e31303038362e636e2f662f736a6678
f . 1 0 0 8 6 . c n / f / s j f x
00 end of inline string value
01 '>' end of attributes
>
03 start of inline string value
e689bee69c8be58f8be38081e69fa5e5a4a9 找朋友、查天
e6b094e38081e79c8be5b08fe8afb4e38081 气、看小说、
e79c8be696b0e997bbe280a6e6898be69cba 看新闻…手机
e9a39ee4bfa1efbc8ce7ae80e58d95e4bda0 飞信,简单你
e79a84e7949fe6b4bbefbc81e8b5b6e5bfab 的生活!赶快
e4b88be8bdbde4bd93e9aa8ce6898be69cba 下载体验手机
e9a39ee4bfa1 飞信
00 end of inline string value
01 </indication>
01 </si>
最终解析得到的XML为:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE si PUBLIC "-//WAPFORUM//DTD SI 1.0//EN"
"http://www.wapforum.org/DTD/si.dtd">
<si>
<indication action="signal-high" href="http://f.10086.cn%2Ff%2Fsjfx">
找朋友、查天气、看小说、看新闻…手机飞信,简单你的生活!赶快下载体验手机飞信
</indication>
</si>
三、带有string table的WBXML
WBXML封装的字符串有inline string和string table两种,这两种字串都以’\0’结束。String table中可以由’\0’结束的多个字符串,stringtable的长度把结束符’\0’计算在内,是所有字串的总长度。
139邮箱的WAP PUSH提醒通知采用了String tables。很多手机终端虽然能收到通常的PUSH消息,但是却接收不到139邮箱的WAP PUSH通知,原因就是不支持带stringtable的WBXML的解析,而忽略了这样的PUSH消息。
下面是带有String table的WAP PUSH SI数据
02056a0fe982aee4bbb63a52653a507573680045c60c03792e31303038362e636e2f693f663d3430
26693d313039383830393834303100080183000101
下面是WBXML到XML的解析:
02 <?xml version="1.0" encoding="UTF-8"?>
05 <!DOCTYPE si PUBLIC "-//WAPFORUM//DTD SI 1.0//EN"
"http://www.wapforum.org/DTD/si.dtd">
6A IANACharset
04 iso-8859-1
17 shift_JIS
6A UTF-8
03 US-ASCII
0f String Table Length
长度是string table中所有string的长度,长度包含结束符’\0’。
e982aee4bbb63a52653a50757368
邮件:Re:Push
00 end of string table value
45 <si>
C6 <indication
0C href="http://
03 start of inline string value
792e31303038362e636e2f693f663d343026693d3130393838303938343031
y.10086.cn/i?f=40&i=10988098401
00 end of inline string value
08 action attribute - signal high
action="signal-high"
01 '>' end of attributes
>
83 String table reference below
00 String table index
01 </indication>
01 </si>
把String Table中的内容替换,得到最终解析出的XML:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE si PUBLIC "-//WAPFORUM//DTD SI 1.0//EN"
"http://www.wapforum.org/DTD/si.dtd">
<si>
<indication href="http://y.10086.cn/i?f=40&i=10988098401" action="signal-high">邮件:Re:Push
</indication>
</si>
四、小结
本文以WAP PUSH Service Indication为例,讲解WAP PUSH的WSP编码和WBXML编码。并对WBXML的两种string——inline string和string table进行了详细阐述。
参考资料
1. WAP Binary XMLContent Format
WBXML标准,必看!
Android上的WAP PUSH解析实现,有源代码,但是解析不全。
WAP PUSH over SMS的大致介绍(英文)
WAP PUSH Service Indication封装实例(英文)
5. Sending SMS WAP Push messages using the ActiveXperts SMS and MMS Toolkit
发送WAP PUSH的工具。是使用说明,虽然没实现细节,但可参考WBXML的Token和Attribute对照。(英文)
反面教材。用固定位置解析,以及固定用000103标识URL结束,固定用000101标识内容结束,简直是胡扯!
关于协议的解析还是要依据标准!用自己遇到的情况可以帮助理解协议,但是据此来做实现的话,只能解析一种情况,被解析内容或格式有少许变化,所做的实现就没用了,到处是BUG。
【修改历史记录】
2012/07/02 对页面布局做了修改