loki/pkg/lokifrontend/frontend/v2/frontend_scheduler_worker.go

package v2

import (
	"context"
	"net/http"
	"sync"
	"time"

	"github.com/cortexproject/cortex/pkg/frontend/v2/frontendv2pb"
	"github.com/cortexproject/cortex/pkg/ring"
	"github.com/cortexproject/cortex/pkg/scheduler/schedulerpb"
	"github.com/cortexproject/cortex/pkg/util"
	"github.com/go-kit/log"
	"github.com/go-kit/log/level"
	"github.com/grafana/dskit/backoff"
	"github.com/grafana/dskit/services"
	"github.com/pkg/errors"
	"github.com/weaveworks/common/httpgrpc"
	"google.golang.org/grpc"

	lokiutil "github.com/grafana/loki/pkg/util"
)

type frontendSchedulerWorkers struct {
	services.Service

	cfg             Config
	logger          log.Logger
	frontendAddress string

	// Channel with requests that should be forwarded to the scheduler.
	requestsCh <-chan *frontendRequest

	watcher services.Service

	mu sync.Mutex
	// Set to nil when stop is called... no more workers are created afterwards.
	workers map[string]*frontendSchedulerWorker
}

func newFrontendSchedulerWorkers(cfg Config, frontendAddress string, ring ring.ReadRing, requestsCh <-chan *frontendRequest, logger log.Logger) (*frontendSchedulerWorkers, error) {
	f := &frontendSchedulerWorkers{
		cfg:             cfg,
		logger:          logger,
		frontendAddress: frontendAddress,
		requestsCh:      requestsCh,
		workers:         map[string]*frontendSchedulerWorker{},
	}

	switch {
	case ring != nil:
		// Use the scheduler ring and RingWatcher to find schedulers.
		w, err := lokiutil.NewRingWatcher(log.With(logger, "component", "frontend-scheduler-worker"), ring, cfg.DNSLookupPeriod, f)
		if err != nil {
			return nil, err
		}
		f.watcher = w
	default:
		// If there is no ring config fallback on using DNS for the frontend scheduler worker to find the schedulers.
		w, err := util.NewDNSWatcher(cfg.SchedulerAddress, cfg.DNSLookupPeriod, f)
		if err != nil {
			return nil, err
		}
		f.watcher = w
	}

	f.Service = services.NewIdleService(f.starting, f.stopping)
	return f, nil
}

func (f *frontendSchedulerWorkers) starting(ctx context.Context) error {
	return services.StartAndAwaitRunning(ctx, f.watcher)
}

func (f *frontendSchedulerWorkers) stopping(_ error) error {
	err := services.StopAndAwaitTerminated(context.Background(), f.watcher)

	f.mu.Lock()
	defer f.mu.Unlock()

	for _, w := range f.workers {
		w.stop()
	}
	f.workers = nil

	return err
}

func (f *frontendSchedulerWorkers) AddressAdded(address string) {
	f.mu.Lock()
	ws := f.workers
	w := f.workers[address]
	f.mu.Unlock()

	// Already stopped or we already have worker for this address.
	if ws == nil || w != nil {
		return
	}

	level.Info(f.logger).Log("msg", "adding connection to scheduler", "addr", address)
	conn, err := f.connectToScheduler(context.Background(), address)
	if err != nil {
		level.Error(f.logger).Log("msg", "error connecting to scheduler", "addr", address, "err", err)
		return
	}

	// No worker for this address yet, start a new one.
	w = newFrontendSchedulerWorker(conn, address, f.frontendAddress, f.requestsCh, f.cfg.WorkerConcurrency, f.logger)

	f.mu.Lock()
	defer f.mu.Unlock()

	// Can be nil if stopping has been called already.
	if f.workers != nil {
		f.workers[address] = w
		w.start()
	}
}

func (f *frontendSchedulerWorkers) AddressRemoved(address string) {
	level.Info(f.logger).Log("msg", "removing connection to scheduler", "addr", address)

	f.mu.Lock()
	// This works fine if f.workers is nil already.
	w := f.workers[address]
	delete(f.workers, address)
	f.mu.Unlock()

	if w != nil {
		w.stop()
	}
}

// Get number of workers.
func (f *frontendSchedulerWorkers) getWorkersCount() int {
	f.mu.Lock()
	defer f.mu.Unlock()

	return len(f.workers)
}

func (f *frontendSchedulerWorkers) connectToScheduler(ctx context.Context, address string) (*grpc.ClientConn, error) {
	// Because we only use single long-running method, it doesn't make sense to inject user ID, send over tracing or add metrics.
	opts, err := f.cfg.GRPCClientConfig.DialOption(nil, nil)
	if err != nil {
		return nil, err
	}

	conn, err := grpc.DialContext(ctx, address, opts...)
	if err != nil {
		return nil, err
	}
	return conn, nil
}

// Worker managing single gRPC connection to Scheduler. Each worker starts multiple goroutines for forwarding
// requests and cancellations to scheduler.
type frontendSchedulerWorker struct {
	log log.Logger

	conn          *grpc.ClientConn
	concurrency   int
	schedulerAddr string
	frontendAddr  string

	// Context and cancellation used by individual goroutines.
	ctx    context.Context
	cancel context.CancelFunc
	wg     sync.WaitGroup

	// Shared between all frontend workers.
	requestCh <-chan *frontendRequest

	// Cancellation requests for this scheduler are received via this channel. It is passed to frontend after
	// query has been enqueued to scheduler.
	cancelCh chan uint64
}

func newFrontendSchedulerWorker(conn *grpc.ClientConn, schedulerAddr string, frontendAddr string, requestCh <-chan *frontendRequest, concurrency int, log log.Logger) *frontendSchedulerWorker {
	w := &frontendSchedulerWorker{
		log:           log,
		conn:          conn,
		concurrency:   concurrency,
		schedulerAddr: schedulerAddr,
		frontendAddr:  frontendAddr,
		requestCh:     requestCh,
		cancelCh:      make(chan uint64),
	}
	w.ctx, w.cancel = context.WithCancel(context.Background())

	return w
}

func (w *frontendSchedulerWorker) start() {
	client := schedulerpb.NewSchedulerForFrontendClient(w.conn)
	for i := 0; i < w.concurrency; i++ {
		w.wg.Add(1)
		go func() {
			defer w.wg.Done()
			w.runOne(w.ctx, client)
		}()
	}
}

func (w *frontendSchedulerWorker) stop() {
	w.cancel()
	w.wg.Wait()
	if err := w.conn.Close(); err != nil {
		level.Error(w.log).Log("msg", "error while closing connection to scheduler", "err", err)
	}
}

func (w *frontendSchedulerWorker) runOne(ctx context.Context, client schedulerpb.SchedulerForFrontendClient) {
	backoffConfig := backoff.Config{
		MinBackoff: 500 * time.Millisecond,
		MaxBackoff: 5 * time.Second,
	}

	backoff := backoff.New(ctx, backoffConfig)
	for backoff.Ongoing() {
		loop, loopErr := client.FrontendLoop(ctx)
		if loopErr != nil {
			level.Error(w.log).Log("msg", "error contacting scheduler", "err", loopErr, "addr", w.schedulerAddr)
			backoff.Wait()
			continue
		}

		loopErr = w.schedulerLoop(loop)
		if closeErr := loop.CloseSend(); closeErr != nil {
			level.Debug(w.log).Log("msg", "failed to close frontend loop", "err", loopErr, "addr", w.schedulerAddr)
		}

		if loopErr != nil {
			level.Error(w.log).Log("msg", "error sending requests to scheduler", "err", loopErr, "addr", w.schedulerAddr)
			backoff.Wait()
			continue
		}

		backoff.Reset()
	}
}

func (w *frontendSchedulerWorker) schedulerLoop(loop schedulerpb.SchedulerForFrontend_FrontendLoopClient) error {
	if err := loop.Send(&schedulerpb.FrontendToScheduler{
		Type:            schedulerpb.INIT,
		FrontendAddress: w.frontendAddr,
	}); err != nil {
		return err
	}

	if resp, err := loop.Recv(); err != nil || resp.Status != schedulerpb.OK {
		if err != nil {
			return err
		}
		return errors.Errorf("unexpected status received for init: %v", resp.Status)
	}

	ctx := loop.Context()

	for {
		select {
		case <-ctx.Done():
			// No need to report error if our internal context is canceled. This can happen during shutdown,
			// or when scheduler is no longer resolvable. (It would be nice if this context reported "done" also when
			// connection scheduler stops the call, but that doesn't seem to be the case).
			//
			// Reporting error here would delay reopening the stream (if the worker context is not done yet).
			level.Debug(w.log).Log("msg", "stream context finished", "err", ctx.Err())
			return nil

		case req := <-w.requestCh:
			err := loop.Send(&schedulerpb.FrontendToScheduler{
				Type:            schedulerpb.ENQUEUE,
				QueryID:         req.queryID,
				UserID:          req.userID,
				HttpRequest:     req.request,
				FrontendAddress: w.frontendAddr,
				StatsEnabled:    req.statsEnabled,
			})

			if err != nil {
				req.enqueue <- enqueueResult{status: failed}
				return err
			}

			resp, err := loop.Recv()
			if err != nil {
				req.enqueue <- enqueueResult{status: failed}
				return err
			}

			switch resp.Status {
			case schedulerpb.OK:
				req.enqueue <- enqueueResult{status: waitForResponse, cancelCh: w.cancelCh}
				// Response will come from querier.

			case schedulerpb.SHUTTING_DOWN:
				// Scheduler is shutting down, report failure to enqueue and stop this loop.
				req.enqueue <- enqueueResult{status: failed}
				return errors.New("scheduler is shutting down")

			case schedulerpb.ERROR:
				req.enqueue <- enqueueResult{status: waitForResponse}
				req.response <- &frontendv2pb.QueryResultRequest{
					HttpResponse: &httpgrpc.HTTPResponse{
						Code: http.StatusInternalServerError,
						Body: []byte(err.Error()),
					},
				}

			case schedulerpb.TOO_MANY_REQUESTS_PER_TENANT:
				req.enqueue <- enqueueResult{status: waitForResponse}
				req.response <- &frontendv2pb.QueryResultRequest{
					HttpResponse: &httpgrpc.HTTPResponse{
						Code: http.StatusTooManyRequests,
						Body: []byte("too many outstanding requests"),
					},
				}
			}

		case reqID := <-w.cancelCh:
			err := loop.Send(&schedulerpb.FrontendToScheduler{
				Type:    schedulerpb.CANCEL,
				QueryID: reqID,
			})

			if err != nil {
				return err
			}

			resp, err := loop.Recv()
			if err != nil {
				return err
			}

			// Scheduler may be shutting down, report that.
			if resp.Status != schedulerpb.OK {
				return errors.Errorf("unexpected status received for cancellation: %v", resp.Status)
			}
		}
	}
}
Loki: Add a ring to the query scheduler to allow discovery via the ring as an alternative to DNS (#4424) * Fork the frontend and scheduler so we can add support for discovery via the ring. * Add a ring to the query scheduler which is then used by the frontend worker and querier workers to find the scheduler address as an alternative to using DNS * update some of the forked code to use dskit grpcclient and grpcutil since #4312 was merged after the original fork was created. * remove query scheduler dependency from querier Signed-off-by: Trevor Whitney <trevorjwhitney@gmail.com> * migrate logging package and make linter happy Signed-off-by: Trevor Whitney <trevorjwhitney@gmail.com> * add SafeReadRing for instances when scheduler is not enabled on same instance * Doc changes from code review A few doc fixes Co-authored-by: Karen Miller <84039272+KMiller-Grafana@users.noreply.github.com> * go mod tidy on go-kit dep * update changelog * remove ReadRing in favor of SafeReadRing Co-authored-by: Trevor Whitney <trevorjwhitney@gmail.com> Co-authored-by: Karen Miller <84039272+KMiller-Grafana@users.noreply.github.com> 4 years ago			`package v2`

			`import (`
			`"context"`
			`"net/http"`
			`"sync"`
			`"time"`

			`"github.com/cortexproject/cortex/pkg/frontend/v2/frontendv2pb"`
			`"github.com/cortexproject/cortex/pkg/ring"`
			`"github.com/cortexproject/cortex/pkg/scheduler/schedulerpb"`
			`"github.com/cortexproject/cortex/pkg/util"`
			`"github.com/go-kit/log"`
			`"github.com/go-kit/log/level"`
			`"github.com/grafana/dskit/backoff"`
			`"github.com/grafana/dskit/services"`
			`"github.com/pkg/errors"`
			`"github.com/weaveworks/common/httpgrpc"`
			`"google.golang.org/grpc"`

			`lokiutil "github.com/grafana/loki/pkg/util"`
			`)`

			`type frontendSchedulerWorkers struct {`
			`services.Service`

			`cfg Config`
			`logger log.Logger`
			`frontendAddress string`

			`// Channel with requests that should be forwarded to the scheduler.`
			`requestsCh <-chan *frontendRequest`

			`watcher services.Service`

			`mu sync.Mutex`
			`// Set to nil when stop is called... no more workers are created afterwards.`
			`workers map[string]*frontendSchedulerWorker`
			`}`

			`func newFrontendSchedulerWorkers(cfg Config, frontendAddress string, ring ring.ReadRing, requestsCh <-chan frontendRequest, logger log.Logger) (frontendSchedulerWorkers, error) {`
			`f := &frontendSchedulerWorkers{`
			`cfg: cfg,`
			`logger: logger,`
			`frontendAddress: frontendAddress,`
			`requestsCh: requestsCh,`
			`workers: map[string]*frontendSchedulerWorker{},`
			`}`

			`switch {`
			`case ring != nil:`
			`// Use the scheduler ring and RingWatcher to find schedulers.`
			`w, err := lokiutil.NewRingWatcher(log.With(logger, "component", "frontend-scheduler-worker"), ring, cfg.DNSLookupPeriod, f)`
			`if err != nil {`
			`return nil, err`
			`}`
			`f.watcher = w`
			`default:`
			`// If there is no ring config fallback on using DNS for the frontend scheduler worker to find the schedulers.`
			`w, err := util.NewDNSWatcher(cfg.SchedulerAddress, cfg.DNSLookupPeriod, f)`
			`if err != nil {`
			`return nil, err`
			`}`
			`f.watcher = w`
			`}`

			`f.Service = services.NewIdleService(f.starting, f.stopping)`
			`return f, nil`
			`}`

			`func (f *frontendSchedulerWorkers) starting(ctx context.Context) error {`
			`return services.StartAndAwaitRunning(ctx, f.watcher)`
			`}`

			`func (f *frontendSchedulerWorkers) stopping(_ error) error {`
			`err := services.StopAndAwaitTerminated(context.Background(), f.watcher)`

			`f.mu.Lock()`
			`defer f.mu.Unlock()`

			`for _, w := range f.workers {`
			`w.stop()`
			`}`
			`f.workers = nil`

			`return err`
			`}`

			`func (f *frontendSchedulerWorkers) AddressAdded(address string) {`
			`f.mu.Lock()`
			`ws := f.workers`
			`w := f.workers[address]`
			`f.mu.Unlock()`

			`// Already stopped or we already have worker for this address.`
			`if ws == nil \|\| w != nil {`
			`return`
			`}`

			`level.Info(f.logger).Log("msg", "adding connection to scheduler", "addr", address)`
			`conn, err := f.connectToScheduler(context.Background(), address)`
			`if err != nil {`
			`level.Error(f.logger).Log("msg", "error connecting to scheduler", "addr", address, "err", err)`
			`return`
			`}`

			`// No worker for this address yet, start a new one.`
			`w = newFrontendSchedulerWorker(conn, address, f.frontendAddress, f.requestsCh, f.cfg.WorkerConcurrency, f.logger)`

			`f.mu.Lock()`
			`defer f.mu.Unlock()`

			`// Can be nil if stopping has been called already.`
			`if f.workers != nil {`
			`f.workers[address] = w`
			`w.start()`
			`}`
			`}`

			`func (f *frontendSchedulerWorkers) AddressRemoved(address string) {`
			`level.Info(f.logger).Log("msg", "removing connection to scheduler", "addr", address)`

			`f.mu.Lock()`
			`// This works fine if f.workers is nil already.`
			`w := f.workers[address]`
			`delete(f.workers, address)`
			`f.mu.Unlock()`

			`if w != nil {`
			`w.stop()`
			`}`
			`}`

			`// Get number of workers.`
			`func (f *frontendSchedulerWorkers) getWorkersCount() int {`
			`f.mu.Lock()`
			`defer f.mu.Unlock()`

			`return len(f.workers)`
			`}`

			`func (f frontendSchedulerWorkers) connectToScheduler(ctx context.Context, address string) (grpc.ClientConn, error) {`
			`// Because we only use single long-running method, it doesn't make sense to inject user ID, send over tracing or add metrics.`
			`opts, err := f.cfg.GRPCClientConfig.DialOption(nil, nil)`
			`if err != nil {`
			`return nil, err`
			`}`

			`conn, err := grpc.DialContext(ctx, address, opts...)`
			`if err != nil {`
			`return nil, err`
			`}`
			`return conn, nil`
			`}`

			`// Worker managing single gRPC connection to Scheduler. Each worker starts multiple goroutines for forwarding`
			`// requests and cancellations to scheduler.`
			`type frontendSchedulerWorker struct {`
			`log log.Logger`

			`conn *grpc.ClientConn`
			`concurrency int`
			`schedulerAddr string`
			`frontendAddr string`

			`// Context and cancellation used by individual goroutines.`
			`ctx context.Context`
			`cancel context.CancelFunc`
			`wg sync.WaitGroup`

			`// Shared between all frontend workers.`
			`requestCh <-chan *frontendRequest`

			`// Cancellation requests for this scheduler are received via this channel. It is passed to frontend after`
			`// query has been enqueued to scheduler.`
			`cancelCh chan uint64`
			`}`

			`func newFrontendSchedulerWorker(conn grpc.ClientConn, schedulerAddr string, frontendAddr string, requestCh <-chan frontendRequest, concurrency int, log log.Logger) *frontendSchedulerWorker {`
			`w := &frontendSchedulerWorker{`
			`log: log,`
			`conn: conn,`
			`concurrency: concurrency,`
			`schedulerAddr: schedulerAddr,`
			`frontendAddr: frontendAddr,`
			`requestCh: requestCh,`
			`cancelCh: make(chan uint64),`
			`}`
			`w.ctx, w.cancel = context.WithCancel(context.Background())`

			`return w`
			`}`

			`func (w *frontendSchedulerWorker) start() {`
			`client := schedulerpb.NewSchedulerForFrontendClient(w.conn)`
			`for i := 0; i < w.concurrency; i++ {`
			`w.wg.Add(1)`
			`go func() {`
			`defer w.wg.Done()`
			`w.runOne(w.ctx, client)`
			`}()`
			`}`
			`}`

			`func (w *frontendSchedulerWorker) stop() {`
			`w.cancel()`
			`w.wg.Wait()`
			`if err := w.conn.Close(); err != nil {`
			`level.Error(w.log).Log("msg", "error while closing connection to scheduler", "err", err)`
			`}`
			`}`

			`func (w *frontendSchedulerWorker) runOne(ctx context.Context, client schedulerpb.SchedulerForFrontendClient) {`
			`backoffConfig := backoff.Config{`
			`MinBackoff: 500 * time.Millisecond,`
			`MaxBackoff: 5 * time.Second,`
			`}`

			`backoff := backoff.New(ctx, backoffConfig)`
			`for backoff.Ongoing() {`
			`loop, loopErr := client.FrontendLoop(ctx)`
			`if loopErr != nil {`
			`level.Error(w.log).Log("msg", "error contacting scheduler", "err", loopErr, "addr", w.schedulerAddr)`
			`backoff.Wait()`
			`continue`
			`}`

			`loopErr = w.schedulerLoop(loop)`
			`if closeErr := loop.CloseSend(); closeErr != nil {`
			`level.Debug(w.log).Log("msg", "failed to close frontend loop", "err", loopErr, "addr", w.schedulerAddr)`
			`}`

			`if loopErr != nil {`
			`level.Error(w.log).Log("msg", "error sending requests to scheduler", "err", loopErr, "addr", w.schedulerAddr)`
			`backoff.Wait()`
			`continue`
			`}`

			`backoff.Reset()`
			`}`
			`}`

			`func (w *frontendSchedulerWorker) schedulerLoop(loop schedulerpb.SchedulerForFrontend_FrontendLoopClient) error {`
			`if err := loop.Send(&schedulerpb.FrontendToScheduler{`
			`Type: schedulerpb.INIT,`
			`FrontendAddress: w.frontendAddr,`
			`}); err != nil {`
			`return err`
			`}`

			`if resp, err := loop.Recv(); err != nil \|\| resp.Status != schedulerpb.OK {`
			`if err != nil {`
			`return err`
			`}`
			`return errors.Errorf("unexpected status received for init: %v", resp.Status)`
			`}`

			`ctx := loop.Context()`

			`for {`
			`select {`
			`case <-ctx.Done():`
			`// No need to report error if our internal context is canceled. This can happen during shutdown,`
			`// or when scheduler is no longer resolvable. (It would be nice if this context reported "done" also when`
			`// connection scheduler stops the call, but that doesn't seem to be the case).`
			`//`
			`// Reporting error here would delay reopening the stream (if the worker context is not done yet).`
			`level.Debug(w.log).Log("msg", "stream context finished", "err", ctx.Err())`
			`return nil`

			`case req := <-w.requestCh:`
			`err := loop.Send(&schedulerpb.FrontendToScheduler{`
			`Type: schedulerpb.ENQUEUE,`
			`QueryID: req.queryID,`
			`UserID: req.userID,`
			`HttpRequest: req.request,`
			`FrontendAddress: w.frontendAddr,`
			`StatsEnabled: req.statsEnabled,`
			`})`

			`if err != nil {`
			`req.enqueue <- enqueueResult{status: failed}`
			`return err`
			`}`

			`resp, err := loop.Recv()`
			`if err != nil {`
			`req.enqueue <- enqueueResult{status: failed}`
			`return err`
			`}`

			`switch resp.Status {`
			`case schedulerpb.OK:`
			`req.enqueue <- enqueueResult{status: waitForResponse, cancelCh: w.cancelCh}`
			`// Response will come from querier.`

			`case schedulerpb.SHUTTING_DOWN:`
			`// Scheduler is shutting down, report failure to enqueue and stop this loop.`
			`req.enqueue <- enqueueResult{status: failed}`
			`return errors.New("scheduler is shutting down")`

			`case schedulerpb.ERROR:`
			`req.enqueue <- enqueueResult{status: waitForResponse}`
			`req.response <- &frontendv2pb.QueryResultRequest{`
			`HttpResponse: &httpgrpc.HTTPResponse{`
			`Code: http.StatusInternalServerError,`
			`Body: []byte(err.Error()),`
			`},`
			`}`

			`case schedulerpb.TOO_MANY_REQUESTS_PER_TENANT:`
			`req.enqueue <- enqueueResult{status: waitForResponse}`
			`req.response <- &frontendv2pb.QueryResultRequest{`
			`HttpResponse: &httpgrpc.HTTPResponse{`
			`Code: http.StatusTooManyRequests,`
			`Body: []byte("too many outstanding requests"),`
			`},`
			`}`
			`}`

			`case reqID := <-w.cancelCh:`
			`err := loop.Send(&schedulerpb.FrontendToScheduler{`
			`Type: schedulerpb.CANCEL,`
			`QueryID: reqID,`
			`})`

			`if err != nil {`
			`return err`
			`}`

			`resp, err := loop.Recv()`
			`if err != nil {`
			`return err`
			`}`

			`// Scheduler may be shutting down, report that.`
			`if resp.Status != schedulerpb.OK {`
			`return errors.Errorf("unexpected status received for cancellation: %v", resp.Status)`
			`}`
			`}`
			`}`
			`}`