refactor: add sort operator

2022-07-11 13:05:26 +08:00 · 2022-07-11 13:05:26 +08:00 · 3b523ca11a
commit 3b523ca11a
parent 133409a81a
11 changed files with 178 additions and 17 deletions
--- a/src/blrec/core/flv_stream_recorder_impl.py
+++ b/src/blrec/core/flv_stream_recorder_impl.py
@ -6,6 +6,7 @@ from reactivex.scheduler import NewThreadScheduler
 from ..bili.live import Live
 from ..bili.typing import QualityNumber
 from ..flv import operators as flv_ops
+from ..utils.mixins import SupportDebugMixin
 from .stream_recorder_impl import StreamRecorderImpl

 __all__ = ('FLVStreamRecorderImpl',)
@ -14,7 +15,7 @@ __all__ = ('FLVStreamRecorderImpl',)
 logger = logging.getLogger(__name__)


-class FLVStreamRecorderImpl(StreamRecorderImpl):
+class FLVStreamRecorderImpl(StreamRecorderImpl, SupportDebugMixin):
    def __init__(
        self,
        live: Live,
@ -40,6 +41,7 @@ class FLVStreamRecorderImpl(StreamRecorderImpl):
            filesize_limit=filesize_limit,
            duration_limit=duration_limit,
        )
+        self._init_for_debug(live.room_id)

    def _run(self) -> None:
        self._subscription = (
@ -52,7 +54,7 @@ class FLVStreamRecorderImpl(StreamRecorderImpl):
                self._stream_parser,
                self._connection_error_handler,
                self._request_exception_handler,
-                flv_ops.process(),
+                flv_ops.process(sort_tags=True, trace=self._debug),
                self._cutter,
                self._limiter,
                self._join_point_extractor,
--- a/src/blrec/flv/common.py
+++ b/src/blrec/flv/common.py
@ -9,7 +9,16 @@ from . import scriptdata
 from .avc import extract_resolution
 from .io import FlvReader
 from .io_protocols import RandomIO
-from .models import AudioTag, AVCPacketType, FlvTag, ScriptTag, TagType, VideoTag
+from .models import (
+    AudioTag,
+    AVCPacketType,
+    CodecID,
+    FlvTag,
+    FrameType,
+    ScriptTag,
+    TagType,
+    VideoTag,
+)
 from .utils import OffsetRepositor


@ -155,8 +164,31 @@ def is_video_nalu_keyframe(tag: FlvTag) -> TypeGuard[VideoTag]:
    return is_video_tag(tag) and tag.is_keyframe() and tag.is_avc_nalu()


+def is_avc_end_sequence(tag: FlvTag) -> TypeGuard[VideoTag]:
+    return is_video_tag(tag) and tag.is_avc_end()
+
+
+def is_avc_end_sequence_tag(value: Any) -> TypeGuard[VideoTag]:
+    return isinstance(value, FlvTag) and is_avc_end_sequence(value)
+
+
+def create_avc_end_sequence_tag(offset: int = 0, timestamp: int = 0) -> VideoTag:
+    return VideoTag(
+        offset=offset,
+        filtered=False,
+        tag_type=TagType.VIDEO,
+        data_size=5,
+        timestamp=timestamp,
+        stream_id=timestamp,
+        frame_type=FrameType.KEY_FRAME,
+        codec_id=CodecID.AVC,
+        avc_packet_type=AVCPacketType.AVC_END_OF_SEQENCE,
+        composition_time=0,
+    )
+
+
 def parse_scriptdata(script_tag: ScriptTag) -> scriptdata.ScriptData:
-    assert script_tag.body is not None
+    assert script_tag.body
    return scriptdata.load(script_tag.body)


@ -253,8 +285,8 @@ class Resolution:
        )

    @classmethod
-    def from_aac_sequence_header(cls, tag: VideoTag) -> Resolution:
+    def from_avc_sequence_header(cls, tag: VideoTag) -> Resolution:
        assert tag.avc_packet_type == AVCPacketType.AVC_SEQUENCE_HEADER
-        assert tag.body is not None
+        assert tag.body
        width, height = extract_resolution(tag.body)
        return cls(width, height)
--- a/src/blrec/flv/format.py
+++ b/src/blrec/flv/format.py
@ -213,10 +213,10 @@ class FlvDumper:
        else:
            raise FlvDataError(f'Unsupported tag type: {tag.tag_type}')

-        if tag.body is None:
-            self._stream.seek(tag.tag_end_offset)
-        else:
+        if tag.body:
            self._writer.write(tag.body)
+        else:
+            self._stream.seek(tag.tag_end_offset)

    def dump_flv_tag_header(self, tag: FlvTag) -> None:
        self._writer.write_ui8((int(tag.filtered) << 5) | tag.tag_type.value)
--- a/src/blrec/flv/models.py
+++ b/src/blrec/flv/models.py
@ -152,7 +152,7 @@ _T = TypeVar('_T', bound='FlvTag')
@attr.s(auto_attribs=True, slots=True, frozen=True, kw_only=True)
 class FlvTag(ABC, FlvTagHeader):
    offset: int = attr.ib(validator=[non_negative_integer_validator])
-    body: Optional[bytes] = attr.ib(default=None, repr=cksum)
+    body: bytes = attr.ib(default=b'', repr=cksum)

    def __len__(self) -> int:
        return self.tag_size
--- a/src/blrec/flv/operators/init.py
+++ b/src/blrec/flv/operators/init.py
@ -11,6 +11,7 @@ from .parse import parse
 from .probe import Prober, StreamProfile
 from .process import process
 from .progress import ProgressBar
+from .sort import sort
 from .split import split

 __all__ = (
@ -33,6 +34,7 @@ __all__ = (
    'Prober',
    'process',
    'ProgressBar',
+    'sort',
    'split',
    'StreamProfile',
 )
--- a/src/blrec/flv/operators/analyse.py
+++ b/src/blrec/flv/operators/analyse.py
@ -328,7 +328,7 @@ class Analyser:
            self._keyframe_timestamps.append(tag.timestamp)
            self._keyframe_filepositions.append(self.calc_file_size())
            if tag.is_avc_header():
-                self._resolution = Resolution.from_aac_sequence_header(tag)
+                self._resolution = Resolution.from_avc_sequence_header(tag)
                logger.debug(f'Resolution: {self._resolution}')
        else:
            pass
--- a/src/blrec/flv/operators/concat.py
+++ b/src/blrec/flv/operators/concat.py
@ -201,7 +201,7 @@ def concat(
                return tag.evolve(timestamp=tag.timestamp + delta)

            def make_join_point_tag(next_tag: FlvTag, seamless: bool) -> ScriptTag:
-                assert next_tag.body is not None
+                assert next_tag.body
                join_point = JoinPoint(
                    seamless=seamless,
                    timestamp=float(next_tag.timestamp),
@ -439,7 +439,7 @@ class JoinPointExtractor:
    ) -> JoinPoint:
        script_data = parse_scriptdata(join_point_tag)
        join_point_data = cast(JoinPointData, script_data['value'])
-        assert next_tag.body is not None, next_tag
+        assert next_tag.body, next_tag
        join_point = JoinPoint(
            seamless=join_point_data['seamless'],
            timestamp=next_tag.timestamp,
--- a/src/blrec/flv/operators/fix.py
+++ b/src/blrec/flv/operators/fix.py
@ -107,10 +107,12 @@ def fix() -> Callable[[FLVStream], FLVStream]:
                    return False

            def is_ts_incontinuous(tag: FlvTag) -> bool:
+                tolerance = 1
                if last_tag is None:
                    return False
-                return tag.timestamp - last_tag.timestamp > max(
-                    sound_sample_interval, video_frame_interval
+                return (
+                    tag.timestamp - last_tag.timestamp
+                    > max(sound_sample_interval, video_frame_interval) + tolerance
                )

            def on_next(item: FLVStreamItem) -> None:
--- a/src/blrec/flv/operators/parse.py
+++ b/src/blrec/flv/operators/parse.py
@ -5,7 +5,9 @@ from typing import Callable, Optional
 from reactivex import Observable, abc
 from reactivex.disposable import CompositeDisposable, Disposable, SerialDisposable

+from ..common import create_avc_end_sequence_tag, is_avc_end_sequence
 from ..io import FlvReader
+from ..models import FlvTag
 from .typing import FLVStream, FLVStreamItem

 __all__ = ('parse',)
@ -30,6 +32,7 @@ def parse(
            subscription = SerialDisposable()

            def on_next(stream: io.RawIOBase) -> None:
+                tag: Optional[FlvTag] = None
                try:
                    try:
                        reader = FlvReader(
@ -42,6 +45,11 @@ def parse(
                            tag = reader.read_tag()
                            observer.on_next(tag)
                    finally:
+                        if tag is not None and not is_avc_end_sequence(tag):
+                            tag = create_avc_end_sequence_tag(
+                                offset=tag.next_tag_offset, timestamp=tag.timestamp
+                            )
+                            observer.on_next(tag)
                        stream.close()
                except EOFError as e:
                    if complete_on_eof:
--- a/src/blrec/flv/operators/process.py
+++ b/src/blrec/flv/operators/process.py
@ -1,9 +1,13 @@
 import logging
 from typing import Callable

+from reactivex import operators as ops
+
+from ..common import is_avc_end_sequence_tag
 from .concat import concat
 from .defragment import defragment
 from .fix import fix
+from .sort import sort
 from .split import split
 from .typing import FLVStream

@ -12,8 +16,26 @@ __all__ = ('process',)
 logger = logging.getLogger(__name__)


-def process() -> Callable[[FLVStream], FLVStream]:
+def process(
+    sort_tags: bool = False, trace: bool = False
+) -> Callable[[FLVStream], FLVStream]:
    def _process(source: FLVStream) -> FLVStream:
-        return source.pipe(defragment(), split(), fix(), concat())
+        if sort_tags:
+            return source.pipe(
+                defragment(),
+                sort(trace=trace),
+                ops.filter(lambda v: not is_avc_end_sequence_tag(v)),  # type: ignore
+                split(),
+                fix(),
+                concat(),
+            )
+        else:
+            return source.pipe(
+                defragment(),
+                ops.filter(lambda v: not is_avc_end_sequence_tag(v)),  # type: ignore
+                split(),
+                fix(),
+                concat(),
+            )

    return _process
--- a/src/blrec/flv/operators/sort.py
+++ b/src/blrec/flv/operators/sort.py
@ -0,0 +1,93 @@
+import logging
+from typing import Callable, List, Optional
+
+from reactivex import Observable, abc
+from reactivex.disposable import CompositeDisposable, Disposable, SerialDisposable
+
+from ..common import is_avc_end_sequence, is_video_nalu_keyframe
+from ..models import FlvHeader, FlvTag
+from .typing import FLVStream, FLVStreamItem
+
+__all__ = ('sort',)
+
+logger = logging.getLogger(__name__)
+
+
+def sort(trace: bool = False) -> Callable[[FLVStream], FLVStream]:
+    "Sort tags in GOP by timestamp to ensure subsequent operators work as expected."
+
+    def _sort(source: FLVStream) -> FLVStream:
+        def subscribe(
+            observer: abc.ObserverBase[FLVStreamItem],
+            scheduler: Optional[abc.SchedulerBase] = None,
+        ) -> abc.DisposableBase:
+            disposed = False
+            subscription = SerialDisposable()
+
+            gop_tags: List[FlvTag] = []
+
+            def reset() -> None:
+                nonlocal gop_tags
+                gop_tags = []
+
+            def push_gop_tags() -> None:
+                if not gop_tags:
+                    return
+
+                gop_tags.sort(key=lambda tag: tag.timestamp)
+                if trace:
+                    logger.debug(
+                        'Tags in GOP:\n'
+                        f'Number of tags: {len(gop_tags)}\n'
+                        f'Total size of tags: {sum(map(len, gop_tags))}\n'
+                        f'The first tag is {gop_tags[0]}\n'
+                        f'The last tag is {gop_tags[-1]}'
+                    )
+
+                for tag in gop_tags:
+                    observer.on_next(tag)
+
+                gop_tags.clear()
+
+            def on_next(item: FLVStreamItem) -> None:
+                if isinstance(item, FlvHeader) or is_avc_end_sequence(item):
+                    push_gop_tags()
+                    observer.on_next(item)
+                    return
+
+                if is_video_nalu_keyframe(item):
+                    push_gop_tags()
+                    gop_tags.append(item)
+                else:
+                    gop_tags.append(item)
+
+            def on_completed() -> None:
+                push_gop_tags()
+                observer.on_completed()
+
+            def on_error(exc: Exception) -> None:
+                push_gop_tags()
+                observer.on_error(exc)
+
+            def dispose() -> None:
+                nonlocal disposed
+                disposed = True
+                if gop_tags:
+                    logger.debug(
+                        'Remaining tags:\n'
+                        f'Number of tags: {len(gop_tags)}\n'
+                        f'Total size of tags: {sum(map(len, gop_tags))}\n'
+                        f'The first tag is {gop_tags[0]}\n'
+                        f'The last tag is {gop_tags[-1]}'
+                    )
+                reset()
+
+            subscription.disposable = source.subscribe(
+                on_next, on_error, on_completed, scheduler=scheduler
+            )
+
+            return CompositeDisposable(subscription, Disposable(dispose))
+
+        return Observable(subscribe)
+
+    return _sort