Доступ к Интернету в Python с использованием Urllib.Request и urlopen()

Доступ к Интернету в Python с использованием Urllib.Request и urlopen()

От автора: Urllib — это модуль Python, который можно использовать для открытия URL-адресов. Он определяет функции и классы для обработки URL-адресов.

С помощью Python вы также можете получать и получать данные из Интернета, такие как XML, HTML, JSON и т. д. Вы также можете использовать Python для непосредственной работы с этими данными. В этом руководстве мы рассмотрим, как можно получать данные из Интернета. Например, здесь мы использовали URL-адрес видео guru99, и мы собираемся получить доступ к этому URL-адресу видео с помощью Python, а также вывести HTML-файл этого URL-адреса.

В этом руководстве мы рассмотрим:

Как открыть URL с помощью Urllib

Как в Python прочитать HTML-файл для URL-адреса

Как открыть URL с помощью Urllib

Перед тем, как запустить код для подключения к интернет-данным, нам импортировать модуль библиотеки URL или «urllib».

Импортируем urllib

Определяем основную функцию

Объявляем переменную webUrl

Затем вызываем функцию urlopen в библиотеке urllib

URL, который мы открываем — это руководство guru99 по YouTube

Далее мы собираемся вывести код результата

Код результата получается путем вызова функции getcode для созданной нами переменной webUrl

Мы собираемся преобразовать это в строку, чтобы ее можно было объединить со строкой «код результата»

Это будет обычный HTTP-код «200», указывающий, что http-запрос успешно обработан

Как в Python получить URL-адрес HTML-файла

Вы также можете прочитать файл HTML, используя «функцию чтения», и когда вы запустите код, файл HTML отобразится в консоли.

Вызовите функцию read для переменной webURL

Переменная Read позволяет читать содержимое файлов данных.

Считать все содержимое URL-адреса в переменную с именем data

Запустите код — он выведет данные в формате HTML

Вот полный код:

Пример Python 2

# # читаем данные с URL-адреса и выводим их
#
import urllib2 def main():
# открываем соединение к URL-адресу с помощью urllib2 webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com") #получаем код результата и выводим его print "result code: " + str(webUrl.getcode()) # читаем данные с URL-адреса и выводим их data = webUrl.read() print data if __name__ == "__main__": main()

Пример Python 3

#
# читаем данные с URL-адреса и выводим их #
import urllib.request
# открываем соединение к URL-адресу с помощью urllib2
webUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com') # получаем код результата и выводим его
print ("result code: " + str(webUrl.getcode())) # читаем данные с URL-адреса и выводим их data = webUrl.read()
print (data)

Источник: https://www.guru99.com

Редакция: Команда webformyself.