短域名进化史

mramydnei 2014-08-20 10:52:00

一个短的域名一直都是很多人所推崇的。因为对于大部分人来说,域名越短就会越好记忆。但是,还存在一部分人,他们不在乎域名是否好记,但是他们巴不得自己的域名只有三位,两位甚至是没有长度。他们,就是XSSer。

0x00 男人为什么要比短


正常的男人都喜欢比谁长,而狂热的XSSer都喜欢比谁短。因为在真实的世界里,我们往往都会遇见字符长度限制。其中的部分问题,是可以通过Short Talk Of XSS中提到的方法进行解决的。但还有一部分极端的场景,是没有办法靠那些硬技术去解决的。比如,我的好友@/fd最近出的prompt.ml这个XSS系列挑战当中就有这样的一道题:

function escape(input) {
    // make sure the script belongs to own site
    // sample script: http://prompt.ml/js/test.js
    if (/^(?:https?:)?\/\/prompt\.ml\//i.test(decodeURIComponent(input))) {
        var script = document.createElement('script');
        script.src = input;
        return script.outerHTML;
    } else {
        return 'Invalid resource.';
    }
}

由于挑战还没有结束,所以在这篇文章中我们会避免一些可能会透露答案的信息。但是,可以确定的是我们是没有办法从src跳出来的。也就是说,故事会围绕怎么在这个场景下调用远程JS文件这个话题进行下去。所以,那些Short Talk Of XSS当中给出的解决方案,对于这种场景来说是无能为力的。我们需要关注的是如何让自己的域名变短。

0×01 短域名之初体验


一个即简单又直接的方法就是买。通常三位的域名,基本上都是XSSer人手一个。比如,我在不久前就买了x55.me.看上去很丑,但是起码算总长度的话,它还是6位的。有了一个短的域名不但能帮助你绕过一些长度限制,还可以让你在与大牛同台竞技时,不会输在非技术性的细节上。

既然靠钱可以解决,那我们为什么不买两位的呢?问题是两位域名价格相对较高而且很难能找到没有被注册。

而且作为有Hack精神的群体,我们更希望用技术来解决问题。所以让我们先回到购买3位域名的问题。有没有办法不花钱就弄到和三位域名一样效果的URL呢?答案是,有的。这里和大家分享一个生成短网址的网站:

http://xn--hqd.ws/

借助这个网站,就可以让我们拥有一个和xxx.xx一样长度的域名来调用远程JS了。^_^

得到生成的链接:

but,wait!那个看上去不怎么可爱的韩文字符长度真的是1么?

让我们打开浏览器验证一下:

看上去Javascript确实认为”ᄒ”的长度为1.但,如果验证长度的是Javascript还需要整这么麻烦?直接抓包改包,不就过去了么?是的,所以让我们在PHP里再做一下验证。php当中判断字符串长度的函数有两个,分别是strlen和mb_strlen。后者,与前者最大的不同就是就是可以在参数中定义字符集。我们来写一个简单的脚本:

<?php
echo 'strlen is:'.strlen($_GET["str"]).'<br>';
echo ' mb_strlen is:'.mb_strlen($_GET["str"]).'<br>';
echo 'utf-8 mb_strlen is:'.mb_strlen($_GET["str"], 'utf-8').'<br>';
echo 'gbk mb_strlen is:'.mb_strlen($_GET["str"], 'gbk').'<br>';
echo 'gb2312 mb_strlen is:'.mb_strlen($_GET["str"], 'gb2312').'<br>';
echo 'gb18030 mb_strlen is:'.mb_strlen($_GET["str"], 'gb18030').'<br>';
echo 'big5 mb_strlen is:'.mb_strlen($_GET["str"], 'big5').'<br>';
?>

通过脚本来观察一下,不同函数和字符集设定的情况下”ᄒ”长度分别会是多少:

可以看到当我们使用更为规范的mb_strlen并将字符集设定为比较常见的utf-8和gb18030时,该字符长度只有1.也就是说,在面对懂得规范输写的码农时,这种方法是成立的。我们并没有花一分钱就得到了一个和三位域名在长度上等效的URL。awesome! PS:由于mb_strlen在字符集为utf-8的情况下,长度结果和控制台是一样的,所以下面都使用控制台截图代替。

但是还不够短,因为后面还有路径。既然韩国人的玩意儿字符长度可以是1,那中文可以么?答案自然是可以的。我们只需要购买一个后缀为两位的中文域名(如果你看明白了,就该懂其实中文,韩文什么的一点都不重要)。而且已经有人这么去做了。比如我们的小伙伴,0x_Jin已经入坑。

http://靖.pw

0×02 Unicode黑魔法


回顾一下,我们从收费的xxx.xx进化到了免费的x.xx/x,再进一步进化到了x.xx。我们已经将域名缩短到了传说中的4位。还能再短么?如果不能就真的没有必要写这个文章了。在这里,需要先感谢@shafigullin教会了我们这个技巧。

http://靖.㎺

看上去pw有些奇怪?没错,因为这并不是p和w,而是unicode字符㎺(U+33BA)。这个也能访问?点一下链接不就知道喽。这是个即神奇但又不陌生的现象。为什么这么说呢,因为我们经常会碰到这样的情况。当我们在忘记切换输入法,拿着中文输入法就在URL敲入:

http://www。baidu。com

并按下回车时,会发现还是会正常跳入www.baidu.com,这个问题其实就已经证明了在hostname中,这种事情是有在发生的。但需要尊重的是,我们谁都没有想过可以借助这种现象来缩短我们的域名长度。所以技术一直都在于创新度而不在于难度。在这里再次表示我对@shafigullin的respect.故事讲到这里,我们的域名已经进化到x.x也就是三位的长度了。但是,我们不可能停留在pw上面,让我们来开始疯狂的fuzzing吧。下面是我的小伙伴@/fd写的一个hostname的fuzzer:

然后我们得到了一些非常有趣的结果。由于内容比较多在这里只显示部分结果。首先是一些可以作为域名后缀的unicode字符:

dz : dz     //valid domain ext
 : rs     //valid domain ext
 : no     //valid domain ext
 : sm     //valid domain ext
 : tel    //valid domain ext
 : tm     //valid domain ext
 : na    // valid domain ext
U+3377 : dm   //valid domain ext
 : ma  // valid domain ext
 : nf  //valid domain ext
 : ml  //valid domain ext
 : fm  //valid domain ext
 : cm  //valid domain ext
 : ps  //valid domain ext
 : ms  //valid domain ext
 : pw  //valid domain ext
 : mw  //valid domain ext
 : cc  //valid domain ext
 : cd  //valid domain ext
 : gy  //valid domain ext
 : in  //valid domain ext
 : ph //valid domain ext
 : pr  //valid domain ext
 : sr  //valid domain ext
 : fi  //valid domain ext
 : st //valid domain ext
 : st //valid domain ext

这样一来,我们能够买的就不单是pw结尾的域名了。不过需要说一下的是,在我们现在的比价结果中,pw是最便宜的。一个汉字.pw的域名在XX互联只需要18元就能拿下了。让我们继续来看其它的一些有趣的结果。这次,让我们继续回到免费这个话题上面。

Ⅷ : viii ㎉ : kcal 可以看到在这次的结果中。我们列出来了两个可以用一个unicode字符代替4个字符的结果。然而.ml结尾的域名,是可以免费注册到长度大于等于4的域名的。所以,我们的小伙伴就抢占先机,拿下了:

Ⅷ.㎖ 和 ㎉.㎖ 4 这样,两个免费的3位域名(总长度)就到手了。但是三位还是有点长。我们能做到2位么?让我们再来看看另一部分的fuzz结果:

 : 1.   //use one unicode char instead of 2 chars and include dot
 : 2.   //use one unicode char instead of 2 chars and include dot
 : 3.   //use one unicode char instead of 2 chars and include dot
 : 4.   //use one unicode char instead of 2 chars and include dot
 : 5.   //use one unicode char instead of 2 chars and include dot
 : 6.   //use one unicode char instead of 2 chars and include dot
 : 7.   //use one unicode char instead of 2 chars and include dot
 : 8.   //use one unicode char instead of 2 chars and include dot
 : 9.   //use one unicode char instead of 2 chars and include dot
 : 10.   //use one unicode char instead of 3 chars and include dot
 : 11.   //use one unicode char instead of 3 chars and include dot
 : 12.   //use one unicode char instead of 3 chars and include dot
 : 13.   //use one unicode char instead of 3 chars and include dot
 : 14.   //use one unicode char instead of 3 chars and include dot
 : 15.   //use one unicode char instead of 3 chars and include dot
 : 16.   //use one unicode char instead of 3 chars and include dot
 : 17.   //use one unicode char instead of 3 chars and include dot
 : 18.   //use one unicode char instead of 3 chars and include dot
 : 19.   //use one unicode char instead of 3 chars and include dot
 : 20.   //use one unicode char instead of 3 chars and include dot
 : p.m. //include dot
 : a.m. //include dot
 : co. //valid domain ext and also include dot

这部分结果,非常的有趣。因为这些unicode字符最后会被解释为带.”的字符。也就是说,如果我们购买了20.xx,然而这个xx又正好是可以用一个unicode字符可以代替的后缀的话,我们的长度就会变成?2位!当然,我们已经这么去做了。这是我们的战利品:

http://⒛₨

PS:当然这不是免费的。如果你有办法注册2位的免费域名也希望你能告诉我

不过机智的你,可能会发现在webkit下面当你点击上面的链接时,会跳转到about:blank。也就是说这种使用带dot的unicode字符的方法在webkit下面是不适用的。那这样一来,如果使用20.₨的话,长度不就又变成3+1了么?我们还有别的辅助:

 : 10   //use one unicode char instead of 2 chars
 : 11   //use one unicode char instead of 2 chars
 : 12   //use one unicode char instead of 2 chars
 : 13   //use one unicode char instead of 2 chars
 : 14   //use one unicode char instead of 2 chars
 : 15   //use one unicode char instead of 2 chars
 : 16   //use one unicode char instead of 2 chars
 : 17   //use one unicode char instead of 2 chars
 : 18   //use one unicode char instead of 2 chars
 : 19   //use one unicode char instead of 2 chars
 : 20   //use one unicode char instead of 2 chars

原来20也是可以通过单个字符来代替的。这样一来,我们就可以通过灵活的切换游走在2位和3位之间了。

http://⑳.₨  //兼容所有浏览器
http://⒛₨  //兼容Firefox和IE

这真是非常激动人心的。在将域名长度缩短到了两位之后,让我们再来看看另外一部分的结果:

℀ : a/c    // path
℁ : a/s    // path
℅ : c/o    // path
℆ : c/u    // path

在这部分结果当中,发现有些unicode字符最终会被解释称 字符/字符。此外,我们之前提到的会带”.”的结果作为二级域名提供给用户,也将会是一个很不错的选择。比如:

http://⒛⒛₨  //兼容IE和FF

0×03 写在最后


这就是,我们在这些日子里不停的fuzzing,思考,调查所得到的结果。

x55.me(6)->20.rs(5)->.pw(4)->.(3)->⒛₨(2)-> 

我们讨论了很多。讨论了如果在这些知识基础上开放一个XSS平台会如何,是否会被山寨?我觉得山寨是肯定会有的。因为trick都已经放出来了,所以对于效仿者来说只需要照着用就可以了。但是,好的技术支持和功能模块也许真的不是ctrl+c就能带走的。所以我相信我们会做出来一个不会被复制的平台。

最后,让我们再次以长度的话题结尾。那么,1位是可能的么?也许对于土豪来说买个tld就是可能的。

http://ai

你需要做的就是买一个可以用单个unicode字符代替的tld。

Thanks for your time.

评论

看风者 2014-08-20 12:11:56

太强了

A

Anymous 2014-08-20 12:23:22

中文的想到了,unicode的没想到

F

F1uYu4n 2014-08-20 12:23:38

很有意思

0

0x_Jin 2014-08-20 12:42:56

终于在M牛的文章中 露了次脸了

A

along 2014-08-20 13:38:06

太强了

W

wkc_2014 2014-08-20 14:01:44

涨姿势了

A

adm1n 2014-08-20 16:13:40

顶M哥

_

_fd 2014-08-20 16:20:28

我是來為parsec打廣告的

W

what_news 2014-08-20 21:31:04

厉害

爱上平顶山 2014-08-20 22:44:44

不错 支持

香草 2014-08-21 10:21:43

fuzzing走起来

S

Sneezry 2014-08-21 16:41:13

我访问http://ai,结果访问到内网了 LoL

黑色的屌丝 2014-08-22 17:01:15


M

M4sk 2014-08-22 17:47:19

NB~

N

noob 2014-08-22 20:57:43

学习到了,这姿势好,感谢大神分享

X

xsser 2014-08-25 14:28:26

重要的还是一个考虑的过程

路人甲 2014-08-26 14:00:16

太牛了,已测试

路人甲 2014-09-06 09:06:48

顶一个 ~

路人甲 2014-09-09 12:15:07

Awesome discovery. Kudos

P

popok 2015-01-22 11:31:04

wooyun筹个款,我们去买一个TLD

路人甲 2015-01-23 10:13:40

太強。

理工小强 2015-06-07 23:25:46

短到如此长度 也是醉了

imlonghao 2015-06-10 12:16:12

Awesome

鱼肠 2016-05-09 22:17:45

赞!!!!!!!!!!

_KernelPanic 2019-05-14 21:11:52

终于有机会感谢师傅了,用这个技巧成功突破过长度限制,非常赞的文章!

mramydnei

xss'"><a>a\

随机分类

逆向安全 文章:70 篇
MongoDB安全 文章:3 篇
网络协议 文章:18 篇
APT 文章:6 篇
木马与病毒 文章:125 篇

扫码关注公众号

WeChat Offical Account QRCode

最新评论

Article_kelp

因为这里的静态目录访功能应该理解为绑定在static路径下的内置路由,你需要用s

N

Nas

师傅您好!_static_url_path那 flag在当前目录下 通过原型链污

Z

zhangy

你好,为什么我也是用windows2016和win10,但是流量是smb3,加密

K

k0uaz

foniw师傅提到的setfge当在类的字段名成是age时不会自动调用。因为获取

Yukong

🐮皮

目录