热门发布
智慧人,会把繁芜的事变变简朴 把喜好的事变做到极致 学会利用一些生存小本领 就可以
生活常用 2025-05-17
网 安 课 堂 网站域名那些事儿 跟着互联网的蓬勃发展,小我或企业开办的网站也越来越
技术学习 2025-04-14
心理学家阿德勒说: “人的统统烦恼,皆源于人际关系。” 人与人之间,或近或远,或
生活常用 2025-04-24
“每逢佳节胖三斤”。有什么小本事可以在享受美食的同时治理好体重?大夫教你6个办法
生活常用 2025-04-15
1、如果自己没有努力,就没有资历批评别人不用心。开口诉苦很容易,但是闭嘴努力的人
励志成长 2025-04-14

【python爬虫】第二讲:网页底子知识

一叶公民 显示全部楼层 发表于 2025-5-26 14:20 |阅读模式 打印 上一主题 下一主题
第二讲:网页底子知识
一. 基本概念:
1.url -- 统一资源定位符(Uniform Resource Locator,缩写为URL),又叫做网页地点,是互联网上标准的资源的地点(Address)。互联网上的每个文件都有一个唯一的URL,它包含的信息指出文件的位置以及欣赏器应该怎么处理处罚它。
2.http -- 超文本传输协议(Hyper Text Transfer Protocol,HTTP)是一个简朴的哀求-响应协议,它平日运行在TCP之上。它指定了客户端可能发送给办事器什么样的消息以及得到什么样的响应。请乞降响应消息的头以ASCII形式给出;而消息内容则具有一个类似MIME的格式。这个简朴模型是早期Web乐成的有功之臣,因为它使开辟和摆设非常地直截了当。
3.HTML-- 的全称为超文本标记说话(Hyper Text Mark Language),是一种标记说话。它包罗一系列标签,通过这些标签可以将网络上的文档格式统一,使分散的Internet资源连接为一个逻辑团体。HTML文本是由HTML下令构成的描述性文本,HTML下令可以分析文字,图形、动画、声音、表格、链接等。超文本是一种组织信息的方式,它通过超等链接方法将文本中的文字、图表与其他信息媒体相关联。这些相互关联的信息媒体可能在同一文本中,也可能是其他文件,或是地舆位置相距遥远的某台盘算机上的文件。这种组织信息方式将分布在差别位置的信息资源用随机方式举行连接,为人们查找,检索信息提供方便。
4.SRC -- 资源文件路径(source),SRC是一个常见的术语。SRC是英文单词source的缩写,指的是资源文件的路径。资源文件包罗图片、音频、视频等。在HTML标签中,SRC属性用于指定资源文件的路径。
二. 网页呈现信息与网页原代码:
1.网页呈现信息 -- 就是我们上网时看到的信息,一样平常包罗文字、图片、音频、视频、动画、背景颜色等。
2.网页原代码 -- 就是编写网页所写的代码。打开方式有三种:
(1)按F12快捷键
(2)在页面鼠标右键 -- 搜查
(3)在页面点击鼠标右键 -- 检察网页源代码
3.网页源代码简朴解读:
(1)标签对:
<title>英语MP3</title>
(2)属性:
<a href=&#39;/uploads/1/file/public/202302/20230201192932_udknd2yg7k.mp3?type=dl&filename=05 Unit 5.mp3&#39; class=&#34;a1&#34;>[下载]</a>
(3)矸
4.常用标签和属性解释:
(1)<html>内容</html> -- 网页说话
(2)<head>内容</head> -- 网页头部
(3)<body>内容</body> -- 网页主体
(4)<a>内容</a> -- 是 anchor 的缩写,基本解释是:锚, 铁锚的。a是HTML说话标签。a标签订义超链接,用于从一个页面链接到另一个页面。a元素最告急的属性是 href 属性,它指定链接的目标。在HTML中标签<a></a> 大概大写字母A 。这些标签的作用是标明超连接的肇端位置或目标位置。
(5)<div>内容</div> -- div标签用作容器,其中可以包含别的的html标签,div标签同时可以继续嵌套div标签。div标签里的内容既可所以文本,也可以嵌套别的标签,图片、视频、段落、标题、等。
(6)<p>内容</p> -- p是段落的意思,其中p是paragraph英文段落的缩写。段落是中英文里的概念基本类似,就是文本块,差别的段落一样平常要另起新行。<p >元素会主动在其前后创立一些空白。欣赏器会主动添加这些空间,也可以在CSS样式表中规定。
(7)<link>内容</link> -- link标签订义文档与外部资源的关系。把外部资源引入,让当前页面可以利用。
(8)<script> 标签用于定义客户端剧本,比如 JavaScript。<script> 元素既可包含剧本语句,也可以通过 src 属性指向外部剧本文件。
(9)href属性:超链接属性
(10)id属性:规定 HTML 元素的唯一的 id;id 在 HTML 文档中必需是唯一的;id 属性可用作链接锚(link anchor),通过 JavaScript(HTML DOM)或通过 CSS 为带有指定 id 的元素改变或添加样式。
(11)class属性:类属性,规定元素的类名(classname)。class 属性重要时间用于指向样式表中的类(class)。不外,也可以利用它通过 JavaScript(HTML DOM)来改变带有指定 class 的 HTML 元素。
(12)lang属性:说话属性。
style属性:样式属性,规定元素的行内样式(inline style)。style 属性将笼罩任何全局的样式设定,比喻在 <style> 标签或在外部样式表中规定的样式。
推广
火星云矿 | 预约S19Pro,享500抵1000!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

有招是一个优质的生活妙招创作平台,在这里,你可以任意分享你的妙招经验,日常生活、技能学习、成长励志、恋爱婚姻……我们相信,每个人都有独特的生活妙招,有着无穷的创造力。
  • 官方手机版

  • 微信公众号

  • 商务合作