[keep2share] Add new extractor

2025-09-11 20:34:14 +09:00 · 2021-04-24 13:53:43 +02:00 · 2021-04-24 13:53:43 +02:00 · 5f3cc3bbea
commit 5f3cc3bbea
parent c6ab792990
2 changed files with 86 additions and 0 deletions
--- a/youtube_dl/extractor/extractors.py
+++ b/youtube_dl/extractor/extractors.py
@ -537,6 +537,7 @@ from .kaltura import KalturaIE
 from .kankan import KankanIE
 from .karaoketv import KaraoketvIE
 from .karrierevideos import KarriereVideosIE
+from .keep2share import Keep2ShareIE
 from .keezmovies import KeezMoviesIE
 from .ketnet import KetnetIE
 from .khanacademy import (
--- a/youtube_dl/extractor/keep2share.py
+++ b/youtube_dl/extractor/keep2share.py
@ -0,0 +1,85 @@
+from __future__ import unicode_literals
+
+import json
+import re
+from .common import (
+    InfoExtractor,
+    RegexNotFoundError,
+)
+from ..utils import (
+    clean_html,
+    compat_str,
+    js_to_json,
+    urljoin,
+    try_get,
+)
+
+
+class Keep2ShareIE(InfoExtractor):
+    _VALID_URL = r'https?://(?:www\.)?(?:k2s\.cc|keep2share\.cc|keep2share\.com)/file/(?P<id>[^/?#]+)'
+    _TESTS = [{
+        'url': 'https://k2s.cc/file/d6f565bcb9581/Big_Buck%20Bunny%20Trailer.mp4',
+        'md5': '0dbce91e7d1efc506d1461439eb8a4c0',
+        'info_dict': {
+            'id': 'd6f565bcb9581',
+            'ext': 'mp4',
+            'title': 'Big Buck Bunny Trailer.mp4',
+            'thumbnail': r're:^https?://.*\.jpe?g$',
+            'filesize': 4447915,
+            'duration': 33.019,
+        },
+    }]
+
+    def _real_extract(self, url):
+        video_id = self._match_id(url)
+
+        # TODO share app_secret across calls to _real_extract
+        app_secret = None
+
+        # retrieve app_secret
+        webpage = self._download_webpage(url, video_id)
+        scripts = re.finditer(r'<script\s+src="(?P<src>/static/[^"]*)"', webpage)
+        for mobj in scripts:
+            src = urljoin(url, clean_html(mobj.group('src')))
+            script = self._download_webpage(src, video_id)
+            secret = self._search_regex(
+                r'REACT_APP_API_CLIENT_SECRET:\s*(?P<secret>%(string)s)' % {
+                    'string': r'"(?:[^"]|\\")*"' + '|' + r"'(?:[^']|\\')*'",
+                }, script, 'app secret', group='secret', default=None)
+            if secret is not None:
+                app_secret = self._parse_json(secret, video_id, transform_source=js_to_json)
+                break
+        else:
+            raise RegexNotFoundError('Unable to extract app secret')
+
+        # retrieve access_token
+        # TODO share access_token across calls fo _real_extract
+        data = {
+            'grant_type': 'client_credentials',
+            'client_id': 'k2s_web_app',
+            'client_secret': app_secret,
+        }
+        data = json.dumps(data, separators=(',', ':')).encode('utf-8')
+        headers = {'Content-Type': 'application/json'}
+        tokens = self._download_json('https://api.k2s.cc/v1/auth/token',
+                                     video_id, data=data, headers=headers)
+        access_token = tokens['access_token']
+
+        # retrieve API page
+        headers = {'Cookie': 'accessToken=' + access_token}
+        info = self._download_json('https://api.k2s.cc/v1/files/' + video_id,
+                                   video_id, headers=headers)
+
+        return {
+            'id': video_id,
+            'title': info.get('name', 'keep2share-file'),
+            'thumbnail': try_get(info, lambda x: x['videoPreview']['cover'], compat_str),
+            'duration': try_get(info, lambda x: x['videoInfo']['duration'], (int, float)),
+            'formats': [{
+                'url': info['videoPreview']['video'],
+                'ext': 'mp4',
+                'filesize': try_get(info, lambda x: x['size'], int),
+                'width': try_get(info, lambda x: x['videoInfo']['resolution']['width'], int),
+                'height': try_get(info, lambda x: x['videoInfo']['resolution']['height'], int),
+            }],
+        }