获取元素方式,内容,属性等内容讲解
树图思维导图提供 Beautiful Soup网页内容解析方法 在线思维导图免费制作,点击“编辑”按钮,可对 Beautiful Soup网页内容解析方法 进行在线思维导图编辑,本思维导图属于思维导图模板主题,文件编号是:6143a2430168b3a322df8adca313a344
BeautifulSoup网页内容解析方法思维导图模板大纲
通过标签名获取元素
soup.tagName:获取页面中所有的tagName元素。
通过类名获取元素
soup.find_all(class_='classname'):获取所有具有指定类名的元素。
通过id获取元素
soup.find(id='elementid'):获取具有指定id的元素。
通过属性获取元素
soup.find_all(attrs={'attr':'value'}):获取所有具有指定属性和属性值的元素。
获取文本的两种方式
element.get_text():获取元素内的所有文本,不包括任何标签。
element.get_text(strip=True):获取元素内的文本,并去除两端的空白字符。
获取子元素和父元素
element.find_all('tagName'):在指定元素内部查找所有的tagName子元素。
element.parent:获取元素的直接父元素。
获取兄弟元素
element.previous_sibling:获取元素的前一个同级元素。
element.next_sibling:获取元素的后一个同级元素。
element['attr']:获取元素的指定属性值。
使用CSS选择器
soup.select('CSS_selector'):使用CSS选择器语法来查找元素。
使用Sizzle选择器
soup.select_sizzle('Sizzle_selector'):使用Sizzle选择器语法来查找元素。
获取所有元素列表的两种方式