bulk-downloader-for-reddit/bdfr/site_downloaders/download_factory.py

#!/usr/bin/env python3
# coding=utf-8

import re
import urllib.parse
from typing import Type

from bdfr.exceptions import NotADownloadableLinkError
from bdfr.site_downloaders.base_downloader import BaseDownloader
from bdfr.site_downloaders.direct import Direct
from bdfr.site_downloaders.erome import Erome
from bdfr.site_downloaders.gallery import Gallery
from bdfr.site_downloaders.gfycat import Gfycat
from bdfr.site_downloaders.gif_delivery_network import GifDeliveryNetwork
from bdfr.site_downloaders.imgur import Imgur
from bdfr.site_downloaders.redgifs import Redgifs
from bdfr.site_downloaders.self_post import SelfPost
from bdfr.site_downloaders.vreddit import VReddit
from bdfr.site_downloaders.youtube import Youtube


class DownloadFactory:
    @staticmethod
    def pull_lever(url: str) -> Type[BaseDownloader]:
        sanitised_url = DownloadFactory._sanitise_url(url)
        if re.match(r'(i\.)?imgur.*\.gifv$', sanitised_url):
            return Imgur
        elif re.match(r'.*/.*\.\w{3,4}(\?[\w;&=]*)?$', sanitised_url):
            return Direct
        elif re.match(r'erome\.com.*', sanitised_url):
            return Erome
        elif re.match(r'reddit\.com/gallery/.*', sanitised_url):
            return Gallery
        elif re.match(r'gfycat\.', sanitised_url):
            return Gfycat
        elif re.match(r'gifdeliverynetwork', sanitised_url):
            return GifDeliveryNetwork
        elif re.match(r'(m\.)?imgur.*', sanitised_url):
            return Imgur
        elif re.match(r'redgifs.com', sanitised_url):
            return Redgifs
        elif re.match(r'reddit\.com/r/', sanitised_url):
            return SelfPost
        elif re.match(r'v\.redd\.it', sanitised_url):
            return VReddit
        elif re.match(r'(m\.)?youtu\.?be', sanitised_url):
            return Youtube
        elif re.match(r'i\.redd\.it.*', sanitised_url):
            return Direct
        else:
            raise NotADownloadableLinkError(f'No downloader module exists for url {url}')

    @staticmethod
    def _sanitise_url(url: str) -> str:
        beginning_regex = re.compile(r'\s*(www\.?)?')
        split_url = urllib.parse.urlsplit(url)
        split_url = split_url.netloc + split_url.path
        split_url = re.sub(beginning_regex, '', split_url)
        return split_url
Add downloader factory 2021-02-11 12:09:37 +13:00			`#!/usr/bin/env python3`
			`# coding=utf-8`

			`import re`
Fix time filters (#279) 2021-04-18 23:24:11 +12:00			`import urllib.parse`
Add downloader factory 2021-02-11 12:09:37 +13:00			`from typing import Type`

Rename module 2021-04-12 19:58:32 +12:00			`from bdfr.exceptions import NotADownloadableLinkError`
			`from bdfr.site_downloaders.base_downloader import BaseDownloader`
			`from bdfr.site_downloaders.direct import Direct`
			`from bdfr.site_downloaders.erome import Erome`
			`from bdfr.site_downloaders.gallery import Gallery`
			`from bdfr.site_downloaders.gfycat import Gfycat`
			`from bdfr.site_downloaders.gif_delivery_network import GifDeliveryNetwork`
			`from bdfr.site_downloaders.imgur import Imgur`
			`from bdfr.site_downloaders.redgifs import Redgifs`
			`from bdfr.site_downloaders.self_post import SelfPost`
			`from bdfr.site_downloaders.vreddit import VReddit`
			`from bdfr.site_downloaders.youtube import Youtube`
Add downloader factory 2021-02-11 12:09:37 +13:00

			`class DownloadFactory:`
			`@staticmethod`
			`def pull_lever(url: str) -> Type[BaseDownloader]:`
Fix time filters (#279) 2021-04-18 23:24:11 +12:00			`sanitised_url = DownloadFactory._sanitise_url(url)`
			`if re.match(r'(i\.)?imgur.*\.gifv$', sanitised_url):`
download_factory.py: check if url has ext first 2021-04-04 04:44:53 +12:00			`return Imgur`
Fix time filters (#279) 2021-04-18 23:24:11 +12:00			`elif re.match(r'./.\.\w{3,4}(\?[\w;&=]*)?$', sanitised_url):`
download_factory.py: check if url has ext first 2021-04-04 04:44:53 +12:00			`return Direct`
Fix time filters (#279) 2021-04-18 23:24:11 +12:00			`elif re.match(r'erome\.com.*', sanitised_url):`
Add downloader factory 2021-02-11 12:09:37 +13:00			`return Erome`
Fix time filters (#279) 2021-04-18 23:24:11 +12:00			`elif re.match(r'reddit\.com/gallery/.*', sanitised_url):`
Add some tests for DownloadFactory 2021-03-01 12:51:44 +13:00			`return Gallery`
Fix time filters (#279) 2021-04-18 23:24:11 +12:00			`elif re.match(r'gfycat\.', sanitised_url):`
Add some tests for DownloadFactory 2021-03-01 12:51:44 +13:00			`return Gfycat`
Fix time filters (#279) 2021-04-18 23:24:11 +12:00			`elif re.match(r'gifdeliverynetwork', sanitised_url):`
Add some tests for DownloadFactory 2021-03-01 12:51:44 +13:00			`return GifDeliveryNetwork`
Fix time filters (#279) 2021-04-18 23:24:11 +12:00			`elif re.match(r'(m\.)?imgur.*', sanitised_url):`
Split regex for download factory 2021-03-28 13:10:46 +13:00			`return Imgur`
Fix time filters (#279) 2021-04-18 23:24:11 +12:00			`elif re.match(r'redgifs.com', sanitised_url):`
Add downloader factory 2021-02-11 12:09:37 +13:00			`return Redgifs`
Fix time filters (#279) 2021-04-18 23:24:11 +12:00			`elif re.match(r'reddit\.com/r/', sanitised_url):`
Add some tests for DownloadFactory 2021-03-01 12:51:44 +13:00			`return SelfPost`
Fix time filters (#279) 2021-04-18 23:24:11 +12:00			`elif re.match(r'v\.redd\.it', sanitised_url):`
Add some tests for DownloadFactory 2021-03-01 12:51:44 +13:00			`return VReddit`
Fix time filters (#279) 2021-04-18 23:24:11 +12:00			`elif re.match(r'(m\.)?youtu\.?be', sanitised_url):`
Add logic to handle mobile youtube (m.youtube) links. 2021-04-02 18:56:31 +13:00			`return Youtube`
Fix time filters (#279) 2021-04-18 23:24:11 +12:00			`elif re.match(r'i\.redd\.it.*', sanitised_url):`
Split regex for download factory 2021-03-28 13:10:46 +13:00			`return Direct`
Add downloader factory 2021-02-11 12:09:37 +13:00			`else:`
Switch to f-string 2021-04-04 11:20:22 +12:00			`raise NotADownloadableLinkError(f'No downloader module exists for url {url}')`
Fix time filters (#279) 2021-04-18 23:24:11 +12:00
			`@staticmethod`
			`def _sanitise_url(url: str) -> str:`
			`beginning_regex = re.compile(r'\s*(www\.?)?')`
			`split_url = urllib.parse.urlsplit(url)`
			`split_url = split_url.netloc + split_url.path`
			`split_url = re.sub(beginning_regex, '', split_url)`
			`return split_url`