loki/pkg/storage/wal/segment.go

package wal

import (
	"bytes"
	"context"
	"encoding/binary"
	"errors"
	"fmt"
	"io"
	"sort"
	"sync"

	"go.uber.org/atomic"

	"github.com/prometheus/prometheus/model/labels"
	"github.com/prometheus/prometheus/storage"

	"github.com/grafana/loki/v3/pkg/ingester-rf1/metastore/metastorepb"
	"github.com/grafana/loki/v3/pkg/logproto"
	tsdbindex "github.com/grafana/loki/v3/pkg/storage/stores/shipper/indexshipper/tsdb/index"
	"github.com/grafana/loki/v3/pkg/storage/wal/chunks"
	"github.com/grafana/loki/v3/pkg/storage/wal/index"
	"github.com/grafana/loki/v3/pkg/util/encoding"
)

// LOKW is the magic number for the Loki WAL format.
var (
	magicNumber       = uint32(0x4C4F4B57)
	magicBuf          [4]byte
	streamSegmentPool = sync.Pool{
		New: func() interface{} {
			return &streamSegment{
				entries: make([]*logproto.Entry, 0, 4096),
			}
		},
	}
	tenantLabel = "__loki_tenant__"
)

func init() {
	binary.BigEndian.PutUint32(magicBuf[:], magicNumber)
}

type streamID struct {
	labels, tenant string
}

type SegmentWriter struct {
	metrics    *SegmentMetrics
	streams    map[streamID]*streamSegment
	buf1       encoding.Encbuf
	outputSize atomic.Int64
	inputSize  atomic.Int64
	idxWriter  *index.Writer
	indexRef   metastorepb.DataRef
}

type streamSegment struct {
	lbls     labels.Labels
	entries  []*logproto.Entry
	tenantID string
	maxt     int64
}

func (s *streamSegment) Reset() {
	for i := range s.entries {
		s.entries[i] = nil
	}
	s.lbls = nil
	s.tenantID = ""
	s.maxt = 0
	s.entries = s.entries[:0]
}

func (s *streamSegment) WriteTo(w io.Writer) (n int64, err error) {
	return chunks.WriteChunk(w, s.entries, chunks.EncodingSnappy)
}

// NewWalSegmentWriter creates a new WalSegmentWriter.
func NewWalSegmentWriter(m *SegmentMetrics) (*SegmentWriter, error) {
	idxWriter, err := index.NewWriter()
	if err != nil {
		return nil, err
	}
	return &SegmentWriter{
		metrics:   m,
		streams:   make(map[streamID]*streamSegment, 64),
		buf1:      encoding.EncWith(make([]byte, 0, 4)),
		idxWriter: idxWriter,
		inputSize: atomic.Int64{},
	}, nil
}

func (b *SegmentWriter) getOrCreateStream(id streamID, lbls labels.Labels) *streamSegment {
	s, ok := b.streams[id]
	if ok {
		return s
	}
	// Check another thread has not created it
	s, ok = b.streams[id]
	if ok {
		return s
	}
	if lbls.Get(tenantLabel) == "" {
		lbls = labels.NewBuilder(lbls).Set(tenantLabel, id.tenant).Labels()
	}
	s = streamSegmentPool.Get().(*streamSegment)
	s.lbls = lbls
	s.tenantID = id.tenant
	b.streams[id] = s
	return s
}

// Labels are passed a string  `{foo="bar",baz="qux"}`  `{foo="foo",baz="foo"}`. labels.Labels => Symbols foo, baz , qux
func (b *SegmentWriter) Append(tenantID, labelsString string, lbls labels.Labels, entries []*logproto.Entry) {
	if len(entries) == 0 {
		return
	}
	for _, e := range entries {
		b.inputSize.Add(int64(len(e.Line)))
	}
	id := streamID{labels: labelsString, tenant: tenantID}
	s := b.getOrCreateStream(id, lbls)

	for i, e := range entries {
		if e.Timestamp.UnixNano() >= s.maxt {
			s.entries = append(s.entries, entries[i])
			s.maxt = e.Timestamp.UnixNano()
			continue
		}
		// search for the right place to insert.
		idx := sort.Search(len(s.entries), func(i int) bool {
			return s.entries[i].Timestamp.UnixNano() > e.Timestamp.UnixNano()
		})
		// insert at the right place.
		s.entries = append(s.entries, nil)
		copy(s.entries[idx+1:], s.entries[idx:])
		s.entries[idx] = e
	}
}

// ReportMetrics for the writer. If called before WriteTo then the output size
// histogram will observe 0.
func (b *SegmentWriter) ReportMetrics() {
	b.metrics.streams.Observe(float64(len(b.streams)))
	tenants := make(map[string]struct{}, 64)
	for _, s := range b.streams {
		tenants[s.tenantID] = struct{}{}
	}
	b.metrics.tenants.Observe(float64(len(tenants)))
	b.metrics.inputSizeBytes.Observe(float64(b.inputSize.Load()))
	b.metrics.outputSizeBytes.Observe(float64(b.outputSize.Load()))
}

func (b *SegmentWriter) Meta(id string) *metastorepb.BlockMeta {
	var globalMinT, globalMaxT int64

	tenants := make(map[string]*metastorepb.TenantStreams, 64)
	for _, s := range b.streams {
		tenant, ok := tenants[s.tenantID]
		if !ok {
			tenant = &metastorepb.TenantStreams{
				TenantId: s.tenantID,
			}
			tenants[s.tenantID] = tenant
		}
		if len(s.entries) == 0 {
			continue
		}
		streamMinT, streamMaxT := s.entries[0].Timestamp.UnixNano(), s.entries[len(s.entries)-1].Timestamp.UnixNano()

		if globalMinT == 0 || streamMinT < globalMinT {
			globalMinT = streamMinT
		}
		if streamMaxT > globalMaxT {
			globalMaxT = streamMaxT
		}
		if tenant.MinTime == 0 || tenant.MinTime > streamMinT {
			tenant.MinTime = streamMinT
		}
		if tenant.MaxTime < streamMaxT {
			tenant.MaxTime = streamMaxT
		}
	}
	result := make([]*metastorepb.TenantStreams, 0, len(tenants))
	for _, tenant := range tenants {
		tenant := tenant
		result = append(result, tenant)
	}
	sort.Slice(result, func(i, j int) bool {
		return result[i].TenantId < result[j].TenantId
	})
	return &metastorepb.BlockMeta{
		Id:              id,
		FormatVersion:   uint64(1),
		CompactionLevel: 0,
		IndexRef:        b.indexRef,
		MinTime:         globalMinT,
		MaxTime:         globalMaxT,
		TenantStreams:   result,
	}
}

func (b *SegmentWriter) WriteTo(w io.Writer) (int64, error) {
	var (
		total   int64
		streams = make([]*streamSegment, 0, len(b.streams))
	)

	// Collect all streams and sort them by tenantID and labels.
	for _, s := range b.streams {
		if len(s.entries) == 0 {
			continue
		}
		streams = append(streams, s)
	}

	sort.Slice(streams, func(i, j int) bool {
		if streams[i].tenantID != streams[j].tenantID {
			return streams[i].tenantID < streams[j].tenantID
		}
		return labels.Compare(streams[i].lbls, streams[j].lbls) < 0
	})

	err := b.idxWriter.Reset()
	if err != nil {
		return total, err
	}

	// Build symbols
	symbolsMap := make(map[string]struct{})
	for _, s := range streams {
		for _, l := range s.lbls {
			symbolsMap[l.Name] = struct{}{}
			symbolsMap[l.Value] = struct{}{}
		}
	}

	// Sort symbols
	symbols := make([]string, 0, len(symbolsMap))
	for s := range symbolsMap {
		symbols = append(symbols, s)
	}
	sort.Strings(symbols)

	// Add symbols
	for _, symbol := range symbols {
		if err := b.idxWriter.AddSymbol(symbol); err != nil {
			return total, err
		}
	}
	// Writes magic header
	n, err := w.Write(magicBuf[:])
	if err != nil {
		return total, err
	}
	total += int64(n)

	// Write all streams to the writer.
	for i, s := range streams {
		if len(s.entries) == 0 {
			continue
		}
		n, err := s.WriteTo(w)
		if err != nil {
			return total, err
		}
		err = b.idxWriter.AddSeries(storage.SeriesRef(i), s.lbls, chunks.Meta{
			MinTime: s.entries[0].Timestamp.UnixNano(),
			MaxTime: s.entries[len(s.entries)-1].Timestamp.UnixNano(),
			Ref:     chunks.NewChunkRef(uint64(total), uint64(n)),
		})
		if err != nil {
			return total, err
		}
		total += n

	}

	if err := b.idxWriter.Close(); err != nil {
		return total, err
	}

	buf, closer, err := b.idxWriter.Buffer()
	if err != nil {
		return total, err
	}
	defer closer.Close()

	n, err = w.Write(buf)
	if err != nil {
		return total, err
	}
	if n != len(buf) {
		return total, errors.New("invalid written index len")
	}
	b.indexRef.Offset = total
	b.indexRef.Length = int64(n)
	total += int64(n)

	// write index len 4b
	b.buf1.PutBE32int(n)
	n, err = w.Write(b.buf1.Get())
	b.buf1.Reset()
	if err != nil {
		return total, err
	}
	total += int64(n)

	// write the version
	n, err = w.Write([]byte{1})
	if err != nil {
		return total, err
	}
	total += int64(n)

	// Writes magic footer
	n, err = w.Write(magicBuf[:])
	if err != nil {
		return total, err
	}
	total += int64(n)

	b.outputSize.Store(total)

	return total, nil
}

// Reset clears the writer.
// After calling Reset, the writer can be reused.
func (b *SegmentWriter) Reset() {
	for _, s := range b.streams {
		s := s
		s.Reset()
		streamSegmentPool.Put(s)
	}
	b.streams = make(map[streamID]*streamSegment, 64)
	b.buf1.Reset()
	b.inputSize.Store(0)
	b.indexRef.Length = 0
	b.indexRef.Offset = 0
}

// InputSize returns the total size of the input data written to the writer.
// It doesn't account for timestamps and labels.
func (b *SegmentWriter) InputSize() int64 {
	return b.inputSize.Load()
}

type SegmentReader struct {
	idr *index.Reader
	b   []byte
}

func NewReader(b []byte) (*SegmentReader, error) {
	if len(b) < 13 {
		return nil, errors.New("segment too small")
	}
	if !bytes.Equal(magicBuf[:], b[:4]) {
		return nil, errors.New("invalid segment header")
	}
	if !bytes.Equal(magicBuf[:], b[len(b)-4:]) {
		return nil, errors.New("invalid segment footer")
	}
	n := 5
	version := b[len(b)-n]
	if version != 1 {
		return nil, fmt.Errorf("invalid segment version: %d", version)
	}
	indexLen := binary.BigEndian.Uint32(b[len(b)-n-4 : len(b)-n])
	n += 4
	idr, err := index.NewReader(index.RealByteSlice(b[len(b)-n-int(indexLen) : len(b)-n]))
	if err != nil {
		return nil, err
	}
	return &SegmentReader{
		idr: idr,
		b:   b[:len(b)-n-int(indexLen)],
	}, nil
}

// todo: Evaluate/benchmark wal segment using apache arrow as format ?

type SeriesIter struct {
	ir  *index.Reader
	ps  tsdbindex.Postings
	err error

	curSeriesRef  storage.SeriesRef
	curLabels     labels.Labels
	labelsBuilder *labels.ScratchBuilder
	chunksMeta    []chunks.Meta
	blocks        []byte
}

func NewSeriesIter(ir *index.Reader, ps tsdbindex.Postings, blocks []byte) *SeriesIter {
	return &SeriesIter{
		ir:            ir,
		ps:            ps,
		blocks:        blocks,
		labelsBuilder: &labels.ScratchBuilder{},
		chunksMeta:    make([]chunks.Meta, 0, 1),
	}
}

func (iter *SeriesIter) Next() bool {
	if !iter.ps.Next() {
		return false
	}
	if iter.ps.At() != iter.curSeriesRef {
		iter.curSeriesRef = iter.ps.At()
		err := iter.ir.Series(iter.curSeriesRef, iter.labelsBuilder, &iter.chunksMeta)
		if err != nil {
			iter.err = err
			return false
		}
		iter.curLabels = iter.labelsBuilder.Labels()
	}
	return true
}

func (iter *SeriesIter) At() labels.Labels {
	return iter.curLabels
}

func (iter *SeriesIter) Err() error {
	return iter.err
}

func (iter *SeriesIter) ChunkReader(_ *chunks.ChunkReader) (*chunks.ChunkReader, error) {
	if len(iter.chunksMeta) == 0 {
		return nil, fmt.Errorf("no chunks found for series %d", iter.curSeriesRef)
	}
	if len(iter.chunksMeta) > 1 {
		return nil, fmt.Errorf("multiple chunks found for series %d", iter.curSeriesRef)
	}
	offset, size := iter.chunksMeta[0].Ref.Unpack()
	if offset < 0 || offset >= len(iter.blocks) || size < 0 || offset+size > len(iter.blocks) {
		return nil, fmt.Errorf("invalid offset or size for series %d: offset %d, size %d, blocks len %d", iter.curSeriesRef, offset, size, len(iter.blocks))
	}

	return chunks.NewChunkReader(iter.blocks[offset : offset+size])
}

func (r *SegmentReader) Series(ctx context.Context) (*SeriesIter, error) {
	ps, err := r.idr.Postings(ctx, index.AllPostingsKey.Name, index.AllPostingsKey.Value)
	if err != nil {
		return nil, err
	}
	if ps.Err() != nil {
		return nil, ps.Err()
	}

	return NewSeriesIter(r.idr, ps, r.b), nil
}

type Sizes struct {
	Index  int64
	Series []int64
}

func (r *SegmentReader) Sizes() (Sizes, error) {
	var sizes Sizes
	sizes.Index = r.idr.Size()
	it, err := r.Series(context.Background())
	if err != nil {
		return sizes, err
	}
	sizes.Series = []int64{}
	for it.Next() {
		_, size := it.chunksMeta[0].Ref.Unpack()
		sizes.Series = append(sizes.Series, int64(size))
	}
	return sizes, err
}
feat: Introduce a new Object Storage WAL format. (#13253) 11 months ago			`package wal`

			`import (`
			`"bytes"`
			`"context"`
			`"encoding/binary"`
			`"errors"`
			`"fmt"`
			`"io"`
			`"sort"`
feat(wal): Benchmark and improve WAL writes using Reset. (#13272) 11 months ago			`"sync"`
feat: Introduce a new Object Storage WAL format. (#13253) 11 months ago
feat: Ingester RF-1 (#13365) 11 months ago			`"go.uber.org/atomic"`

feat: Introduce a new Object Storage WAL format. (#13253) 11 months ago			`"github.com/prometheus/prometheus/model/labels"`
			`"github.com/prometheus/prometheus/storage"`

feat: Bootstrap metastore for wal segments (#13550) 10 months ago			`"github.com/grafana/loki/v3/pkg/ingester-rf1/metastore/metastorepb"`
feat: Introduce a new Object Storage WAL format. (#13253) 11 months ago			`"github.com/grafana/loki/v3/pkg/logproto"`
			`tsdbindex "github.com/grafana/loki/v3/pkg/storage/stores/shipper/indexshipper/tsdb/index"`
			`"github.com/grafana/loki/v3/pkg/storage/wal/chunks"`
			`"github.com/grafana/loki/v3/pkg/storage/wal/index"`
			`"github.com/grafana/loki/v3/pkg/util/encoding"`
			`)`

			`// LOKW is the magic number for the Loki WAL format.`
			`var (`
feat(wal): Benchmark and improve WAL writes using Reset. (#13272) 11 months ago			`magicNumber = uint32(0x4C4F4B57)`
			`magicBuf [4]byte`
			`streamSegmentPool = sync.Pool{`
			`New: func() interface{} {`
			`return &streamSegment{`
			`entries: make([]*logproto.Entry, 0, 4096),`
			`}`
			`},`
			`}`
chore: Refactor storage interface for rf1 (#13415) 11 months ago			`tenantLabel = "__loki_tenant__"`
feat: Introduce a new Object Storage WAL format. (#13253) 11 months ago			`)`

			`func init() {`
			`binary.BigEndian.PutUint32(magicBuf[:], magicNumber)`
			`}`

			`type streamID struct {`
			`labels, tenant string`
			`}`

			`type SegmentWriter struct {`
feat: remove mutexes from wal.SegmentWriter (#13641) 10 months ago			`metrics *SegmentMetrics`
			`streams map[streamID]*streamSegment`
			`buf1 encoding.Encbuf`
			`outputSize atomic.Int64`
			`inputSize atomic.Int64`
			`idxWriter *index.Writer`
			`indexRef metastorepb.DataRef`
feat: Introduce a new Object Storage WAL format. (#13253) 11 months ago			`}`

			`type streamSegment struct {`
			`lbls labels.Labels`
			`entries []*logproto.Entry`
			`tenantID string`
			`maxt int64`
			`}`

feat(wal): Benchmark and improve WAL writes using Reset. (#13272) 11 months ago			`func (s *streamSegment) Reset() {`
fix: Properly reset wal segment writer (#13468) 11 months ago			`for i := range s.entries {`
			`s.entries[i] = nil`
			`}`
			`s.lbls = nil`
			`s.tenantID = ""`
			`s.maxt = 0`
feat(wal): Benchmark and improve WAL writes using Reset. (#13272) 11 months ago			`s.entries = s.entries[:0]`
			`}`

feat: convert WalSegmentWriter to io.ReadSeeker (#13340) Signed-off-by: Vladyslav Diachenko <vlad.diachenko@grafana.com> 11 months ago			`func (s *streamSegment) WriteTo(w io.Writer) (n int64, err error) {`
			`return chunks.WriteChunk(w, s.entries, chunks.EncodingSnappy)`
			`}`

feat: Introduce a new Object Storage WAL format. (#13253) 11 months ago			`// NewWalSegmentWriter creates a new WalSegmentWriter.`
feat: Add metrics for Ingester RF-1 (#13510) 10 months ago			`func NewWalSegmentWriter(m SegmentMetrics) (SegmentWriter, error) {`
feat(wal): Benchmark and improve WAL writes using Reset. (#13272) 11 months ago			`idxWriter, err := index.NewWriter()`
			`if err != nil {`
			`return nil, err`
feat: Introduce a new Object Storage WAL format. (#13253) 11 months ago			`}`
feat(wal): Benchmark and improve WAL writes using Reset. (#13272) 11 months ago			`return &SegmentWriter{`
feat: remove mutexes from wal.SegmentWriter (#13641) 10 months ago			`metrics: m,`
			`streams: make(map[streamID]*streamSegment, 64),`
			`buf1: encoding.EncWith(make([]byte, 0, 4)),`
			`idxWriter: idxWriter,`
			`inputSize: atomic.Int64{},`
feat(wal): Benchmark and improve WAL writes using Reset. (#13272) 11 months ago			`}, nil`
feat: Introduce a new Object Storage WAL format. (#13253) 11 months ago			`}`

feat: Ingester RF-1 (#13365) 11 months ago			`func (b SegmentWriter) getOrCreateStream(id streamID, lbls labels.Labels) streamSegment {`
			`s, ok := b.streams[id]`
			`if ok {`
			`return s`
			`}`
			`// Check another thread has not created it`
			`s, ok = b.streams[id]`
			`if ok {`
			`return s`
			`}`
			`if lbls.Get(tenantLabel) == "" {`
			`lbls = labels.NewBuilder(lbls).Set(tenantLabel, id.tenant).Labels()`
			`}`
			`s = streamSegmentPool.Get().(*streamSegment)`
			`s.lbls = lbls`
			`s.tenantID = id.tenant`
			`b.streams[id] = s`
			`return s`
			`}`

feat: Introduce a new Object Storage WAL format. (#13253) 11 months ago			// Labels are passed a string `{foo="bar",baz="qux"}` `{foo="foo",baz="foo"}`. labels.Labels => Symbols foo, baz , qux
			`func (b SegmentWriter) Append(tenantID, labelsString string, lbls labels.Labels, entries []logproto.Entry) {`
			`if len(entries) == 0 {`
			`return`
			`}`
feat(wal): Add sizing information to writer and reader. (#13267) 11 months ago			`for _, e := range entries {`
feat: Ingester RF-1 (#13365) 11 months ago			`b.inputSize.Add(int64(len(e.Line)))`
feat(wal): Add sizing information to writer and reader. (#13267) 11 months ago			`}`
feat: Introduce a new Object Storage WAL format. (#13253) 11 months ago			`id := streamID{labels: labelsString, tenant: tenantID}`
feat: Ingester RF-1 (#13365) 11 months ago			`s := b.getOrCreateStream(id, lbls)`
feat: Introduce a new Object Storage WAL format. (#13253) 11 months ago
			`for i, e := range entries {`
			`if e.Timestamp.UnixNano() >= s.maxt {`
			`s.entries = append(s.entries, entries[i])`
			`s.maxt = e.Timestamp.UnixNano()`
			`continue`
			`}`
			`// search for the right place to insert.`
			`idx := sort.Search(len(s.entries), func(i int) bool {`
			`return s.entries[i].Timestamp.UnixNano() > e.Timestamp.UnixNano()`
			`})`
			`// insert at the right place.`
			`s.entries = append(s.entries, nil)`
			`copy(s.entries[idx+1:], s.entries[idx:])`
			`s.entries[idx] = e`
			`}`
			`}`

chore: Rename PendingItem to PendingSegment and clean up flush.go (#13554) 10 months ago			`// ReportMetrics for the writer. If called before WriteTo then the output size`
			`// histogram will observe 0.`
			`func (b *SegmentWriter) ReportMetrics() {`
feat: Add metrics for Ingester RF-1 (#13510) 10 months ago			`b.metrics.streams.Observe(float64(len(b.streams)))`
feat: Bootstrap metastore for wal segments (#13550) 10 months ago			`tenants := make(map[string]struct{}, 64)`
feat: Add metrics for Ingester RF-1 (#13510) 10 months ago			`for _, s := range b.streams {`
			`tenants[s.tenantID] = struct{}{}`
			`}`
			`b.metrics.tenants.Observe(float64(len(tenants)))`
			`b.metrics.inputSizeBytes.Observe(float64(b.inputSize.Load()))`
			`b.metrics.outputSizeBytes.Observe(float64(b.outputSize.Load()))`
			`}`

feat: Bootstrap metastore for wal segments (#13550) 10 months ago			`func (b SegmentWriter) Meta(id string) metastorepb.BlockMeta {`
			`var globalMinT, globalMaxT int64`

			`tenants := make(map[string]*metastorepb.TenantStreams, 64)`
			`for _, s := range b.streams {`
			`tenant, ok := tenants[s.tenantID]`
			`if !ok {`
			`tenant = &metastorepb.TenantStreams{`
			`TenantId: s.tenantID,`
			`}`
			`tenants[s.tenantID] = tenant`
			`}`
			`if len(s.entries) == 0 {`
			`continue`
			`}`
			`streamMinT, streamMaxT := s.entries[0].Timestamp.UnixNano(), s.entries[len(s.entries)-1].Timestamp.UnixNano()`

			`if globalMinT == 0 \|\| streamMinT < globalMinT {`
			`globalMinT = streamMinT`
			`}`
			`if streamMaxT > globalMaxT {`
			`globalMaxT = streamMaxT`
			`}`
			`if tenant.MinTime == 0 \|\| tenant.MinTime > streamMinT {`
			`tenant.MinTime = streamMinT`
			`}`
			`if tenant.MaxTime < streamMaxT {`
			`tenant.MaxTime = streamMaxT`
			`}`
			`}`
			`result := make([]*metastorepb.TenantStreams, 0, len(tenants))`
			`for _, tenant := range tenants {`
			`tenant := tenant`
			`result = append(result, tenant)`
			`}`
			`sort.Slice(result, func(i, j int) bool {`
			`return result[i].TenantId < result[j].TenantId`
			`})`
			`return &metastorepb.BlockMeta{`
			`Id: id,`
			`FormatVersion: uint64(1),`
			`CompactionLevel: 0,`
feat(rf1): Store index ref in metastore (#13613) 10 months ago			`IndexRef: b.indexRef,`
feat: Bootstrap metastore for wal segments (#13550) 10 months ago			`MinTime: globalMinT,`
			`MaxTime: globalMaxT,`
			`TenantStreams: result,`
			`}`
			`}`

feat: Introduce a new Object Storage WAL format. (#13253) 11 months ago			`func (b *SegmentWriter) WriteTo(w io.Writer) (int64, error) {`
			`var (`
			`total int64`
feat(wal): Benchmark and improve WAL writes using Reset. (#13272) 11 months ago			`streams = make([]*streamSegment, 0, len(b.streams))`
feat: Introduce a new Object Storage WAL format. (#13253) 11 months ago			`)`

			`// Collect all streams and sort them by tenantID and labels.`
feat(wal): Benchmark and improve WAL writes using Reset. (#13272) 11 months ago			`for _, s := range b.streams {`
			`if len(s.entries) == 0 {`
			`continue`
			`}`
			`streams = append(streams, s)`
			`}`

feat: Introduce a new Object Storage WAL format. (#13253) 11 months ago			`sort.Slice(streams, func(i, j int) bool {`
			`if streams[i].tenantID != streams[j].tenantID {`
			`return streams[i].tenantID < streams[j].tenantID`
			`}`
			`return labels.Compare(streams[i].lbls, streams[j].lbls) < 0`
			`})`

feat(wal): Benchmark and improve WAL writes using Reset. (#13272) 11 months ago			`err := b.idxWriter.Reset()`
feat: Introduce a new Object Storage WAL format. (#13253) 11 months ago			`if err != nil {`
			`return total, err`
			`}`

			`// Build symbols`
			`symbolsMap := make(map[string]struct{})`
			`for _, s := range streams {`
			`for _, l := range s.lbls {`
			`symbolsMap[l.Name] = struct{}{}`
			`symbolsMap[l.Value] = struct{}{}`
			`}`
			`}`

			`// Sort symbols`
			`symbols := make([]string, 0, len(symbolsMap))`
			`for s := range symbolsMap {`
			`symbols = append(symbols, s)`
			`}`
			`sort.Strings(symbols)`

			`// Add symbols`
			`for _, symbol := range symbols {`
feat(wal): Benchmark and improve WAL writes using Reset. (#13272) 11 months ago			`if err := b.idxWriter.AddSymbol(symbol); err != nil {`
feat: Introduce a new Object Storage WAL format. (#13253) 11 months ago			`return total, err`
			`}`
			`}`
			`// Writes magic header`
			`n, err := w.Write(magicBuf[:])`
			`if err != nil {`
			`return total, err`
			`}`
			`total += int64(n)`

			`// Write all streams to the writer.`
			`for i, s := range streams {`
			`if len(s.entries) == 0 {`
			`continue`
			`}`
			`n, err := s.WriteTo(w)`
			`if err != nil {`
			`return total, err`
			`}`
feat(wal): Benchmark and improve WAL writes using Reset. (#13272) 11 months ago			`err = b.idxWriter.AddSeries(storage.SeriesRef(i), s.lbls, chunks.Meta{`
feat: Introduce a new Object Storage WAL format. (#13253) 11 months ago			`MinTime: s.entries[0].Timestamp.UnixNano(),`
			`MaxTime: s.entries[len(s.entries)-1].Timestamp.UnixNano(),`
			`Ref: chunks.NewChunkRef(uint64(total), uint64(n)),`
			`})`
			`if err != nil {`
			`return total, err`
			`}`
			`total += n`

			`}`

feat(wal): Benchmark and improve WAL writes using Reset. (#13272) 11 months ago			`if err := b.idxWriter.Close(); err != nil {`
feat: Introduce a new Object Storage WAL format. (#13253) 11 months ago			`return total, err`
			`}`

feat(wal): Benchmark and improve WAL writes using Reset. (#13272) 11 months ago			`buf, closer, err := b.idxWriter.Buffer()`
feat: Introduce a new Object Storage WAL format. (#13253) 11 months ago			`if err != nil {`
			`return total, err`
			`}`
			`defer closer.Close()`

			`n, err = w.Write(buf)`
			`if err != nil {`
			`return total, err`
			`}`
			`if n != len(buf) {`
			`return total, errors.New("invalid written index len")`
			`}`
feat(rf1): Store index ref in metastore (#13613) 10 months ago			`b.indexRef.Offset = total`
			`b.indexRef.Length = int64(n)`
feat: Introduce a new Object Storage WAL format. (#13253) 11 months ago			`total += int64(n)`

			`// write index len 4b`
			`b.buf1.PutBE32int(n)`
			`n, err = w.Write(b.buf1.Get())`
feat: convert WalSegmentWriter to io.ReadSeeker (#13340) Signed-off-by: Vladyslav Diachenko <vlad.diachenko@grafana.com> 11 months ago			`b.buf1.Reset()`
feat: Introduce a new Object Storage WAL format. (#13253) 11 months ago			`if err != nil {`
			`return total, err`
			`}`
			`total += int64(n)`

			`// write the version`
			`n, err = w.Write([]byte{1})`
			`if err != nil {`
			`return total, err`
			`}`
			`total += int64(n)`

			`// Writes magic footer`
			`n, err = w.Write(magicBuf[:])`
			`if err != nil {`
			`return total, err`
			`}`
			`total += int64(n)`

feat: Add metrics for Ingester RF-1 (#13510) 10 months ago			`b.outputSize.Store(total)`

feat: Introduce a new Object Storage WAL format. (#13253) 11 months ago			`return total, nil`
			`}`

			`// Reset clears the writer.`
			`// After calling Reset, the writer can be reused.`
			`func (b *SegmentWriter) Reset() {`
feat(wal): Benchmark and improve WAL writes using Reset. (#13272) 11 months ago			`for _, s := range b.streams {`
			`s := s`
fix: Properly reset wal segment writer (#13468) 11 months ago			`s.Reset()`
feat(wal): Benchmark and improve WAL writes using Reset. (#13272) 11 months ago			`streamSegmentPool.Put(s)`
			`}`
			`b.streams = make(map[streamID]*streamSegment, 64)`
feat: Ingester RF-1 (#13365) 11 months ago			`b.buf1.Reset()`
			`b.inputSize.Store(0)`
feat(rf1): Store index ref in metastore (#13613) 10 months ago			`b.indexRef.Length = 0`
			`b.indexRef.Offset = 0`
feat(wal): Add sizing information to writer and reader. (#13267) 11 months ago			`}`

			`// InputSize returns the total size of the input data written to the writer.`
			`// It doesn't account for timestamps and labels.`
			`func (b *SegmentWriter) InputSize() int64 {`
feat: Ingester RF-1 (#13365) 11 months ago			`return b.inputSize.Load()`
feat: Introduce a new Object Storage WAL format. (#13253) 11 months ago			`}`

			`type SegmentReader struct {`
			`idr *index.Reader`
			`b []byte`
			`}`

			`func NewReader(b []byte) (*SegmentReader, error) {`
			`if len(b) < 13 {`
			`return nil, errors.New("segment too small")`
			`}`
			`if !bytes.Equal(magicBuf[:], b[:4]) {`
			`return nil, errors.New("invalid segment header")`
			`}`
			`if !bytes.Equal(magicBuf[:], b[len(b)-4:]) {`
			`return nil, errors.New("invalid segment footer")`
			`}`
			`n := 5`
			`version := b[len(b)-n]`
			`if version != 1 {`
			`return nil, fmt.Errorf("invalid segment version: %d", version)`
			`}`
			`indexLen := binary.BigEndian.Uint32(b[len(b)-n-4 : len(b)-n])`
			`n += 4`
			`idr, err := index.NewReader(index.RealByteSlice(b[len(b)-n-int(indexLen) : len(b)-n]))`
			`if err != nil {`
			`return nil, err`
			`}`
			`return &SegmentReader{`
			`idr: idr,`
			`b: b[:len(b)-n-int(indexLen)],`
			`}, nil`
			`}`

			`// todo: Evaluate/benchmark wal segment using apache arrow as format ?`

			`type SeriesIter struct {`
			`ir *index.Reader`
			`ps tsdbindex.Postings`
			`err error`

			`curSeriesRef storage.SeriesRef`
			`curLabels labels.Labels`
			`labelsBuilder *labels.ScratchBuilder`
			`chunksMeta []chunks.Meta`
			`blocks []byte`
			`}`

			`func NewSeriesIter(ir index.Reader, ps tsdbindex.Postings, blocks []byte) SeriesIter {`
			`return &SeriesIter{`
			`ir: ir,`
			`ps: ps,`
			`blocks: blocks,`
			`labelsBuilder: &labels.ScratchBuilder{},`
			`chunksMeta: make([]chunks.Meta, 0, 1),`
			`}`
			`}`

			`func (iter *SeriesIter) Next() bool {`
			`if !iter.ps.Next() {`
			`return false`
			`}`
			`if iter.ps.At() != iter.curSeriesRef {`
			`iter.curSeriesRef = iter.ps.At()`
			`err := iter.ir.Series(iter.curSeriesRef, iter.labelsBuilder, &iter.chunksMeta)`
			`if err != nil {`
			`iter.err = err`
			`return false`
			`}`
			`iter.curLabels = iter.labelsBuilder.Labels()`
			`}`
			`return true`
			`}`

			`func (iter *SeriesIter) At() labels.Labels {`
			`return iter.curLabels`
			`}`

			`func (iter *SeriesIter) Err() error {`
			`return iter.err`
			`}`

			`func (iter SeriesIter) ChunkReader(_ chunks.ChunkReader) (*chunks.ChunkReader, error) {`
			`if len(iter.chunksMeta) == 0 {`
			`return nil, fmt.Errorf("no chunks found for series %d", iter.curSeriesRef)`
			`}`
			`if len(iter.chunksMeta) > 1 {`
			`return nil, fmt.Errorf("multiple chunks found for series %d", iter.curSeriesRef)`
			`}`
			`offset, size := iter.chunksMeta[0].Ref.Unpack()`
			`if offset < 0 \|\| offset >= len(iter.blocks) \|\| size < 0 \|\| offset+size > len(iter.blocks) {`
			`return nil, fmt.Errorf("invalid offset or size for series %d: offset %d, size %d, blocks len %d", iter.curSeriesRef, offset, size, len(iter.blocks))`
			`}`

			`return chunks.NewChunkReader(iter.blocks[offset : offset+size])`
			`}`

			`func (r SegmentReader) Series(ctx context.Context) (SeriesIter, error) {`
			`ps, err := r.idr.Postings(ctx, index.AllPostingsKey.Name, index.AllPostingsKey.Value)`
			`if err != nil {`
			`return nil, err`
			`}`
			`if ps.Err() != nil {`
			`return nil, ps.Err()`
			`}`

			`return NewSeriesIter(r.idr, ps, r.b), nil`
			`}`
feat(wal): Add sizing information to writer and reader. (#13267) 11 months ago
			`type Sizes struct {`
			`Index int64`
			`Series []int64`
			`}`

			`func (r *SegmentReader) Sizes() (Sizes, error) {`
			`var sizes Sizes`
			`sizes.Index = r.idr.Size()`
			`it, err := r.Series(context.Background())`
			`if err != nil {`
			`return sizes, err`
			`}`
			`sizes.Series = []int64{}`
			`for it.Next() {`
			`_, size := it.chunksMeta[0].Ref.Unpack()`
			`sizes.Series = append(sizes.Series, int64(size))`
			`}`
			`return sizes, err`
			`}`