OSDN Git Service

fix dir
[bytom/vapor.git] / toolbar / precog / monitor / monitor.go
index 334ddd7..a9ac263 100644 (file)
@@ -2,12 +2,10 @@ package monitor
 
 import (
        "fmt"
-       "io/ioutil"
        "os"
        "os/user"
        "strings"
-       "sync/atomic"
-       "time"
+       "sync"
 
        "github.com/jinzhu/gorm"
        log "github.com/sirupsen/logrus"
@@ -18,9 +16,8 @@ import (
        "github.com/vapor/event"
        "github.com/vapor/netsync/chainmgr"
        "github.com/vapor/netsync/consensusmgr"
-       "github.com/vapor/p2p"
-       // msgs "github.com/vapor/netsync/messages"
        "github.com/vapor/netsync/peers"
+       "github.com/vapor/p2p"
        "github.com/vapor/p2p/discover/dht"
        "github.com/vapor/p2p/discover/mdns"
        "github.com/vapor/p2p/signlib"
@@ -29,21 +26,26 @@ import (
 )
 
 type monitor struct {
-       cfg       *config.Config
-       db        *gorm.DB
-       nodeCfg   *vaporCfg.Config
-       sw        *p2p.Switch
-       discvCh   chan *dht.Node
-       privKey   chainkd.XPrv
-       chain     *mock.Chain
-       txPool    *mock.Mempool
-       connected uint32
+       *sync.RWMutex
+       cfg     *config.Config
+       db      *gorm.DB
+       nodeCfg *vaporCfg.Config
+       sw      *p2p.Switch
+       privKey chainkd.XPrv
+       chain   *mock.Chain
+       txPool  *mock.Mempool
+       // discvMap maps a node's public key to the node itself
+       discvMap map[string]*dht.Node
+       discvCh  chan *dht.Node
+       dialCh   chan struct{}
+       // TODO: maybe remove?
+       checkStatusCh chan struct{}
 }
 
 // TODO: set myself as SPV?
 func NewMonitor(cfg *config.Config, db *gorm.DB) *monitor {
        //TODO: for test
-       cfg.CheckFreqSeconds = 30
+       cfg.CheckFreqSeconds = 15
 
        dbPath, err := makePath()
        if err != nil {
@@ -57,7 +59,6 @@ func NewMonitor(cfg *config.Config, db *gorm.DB) *monitor {
        }
        nodeCfg.DBPath = dbPath
        nodeCfg.ChainID = "mainnet"
-       discvCh := make(chan *dht.Node)
        privKey, err := signlib.NewPrivKey()
        if err != nil {
                log.Fatal(err)
@@ -69,16 +70,21 @@ func NewMonitor(cfg *config.Config, db *gorm.DB) *monitor {
        }
 
        return &monitor{
-               cfg:     cfg,
-               db:      db,
-               nodeCfg: nodeCfg,
-               discvCh: discvCh,
-               privKey: privKey.(chainkd.XPrv),
-               chain:   chain,
-               txPool:  txPool,
+               RWMutex:       &sync.RWMutex{},
+               cfg:           cfg,
+               db:            db,
+               nodeCfg:       nodeCfg,
+               privKey:       privKey.(chainkd.XPrv),
+               chain:         chain,
+               txPool:        txPool,
+               discvMap:      make(map[string]*dht.Node),
+               discvCh:       make(chan *dht.Node),
+               dialCh:        make(chan struct{}, 1),
+               checkStatusCh: make(chan struct{}, 1),
        }
 }
 
+// TODO: need to fix temp and "discover"
 func makePath() (string, error) {
        usr, err := user.Current()
        if err != nil {
@@ -90,12 +96,7 @@ func makePath() (string, error) {
                return "", err
        }
 
-       tmpDir, err := ioutil.TempDir(dataPath, "")
-       if err != nil {
-               return "", err
-       }
-
-       return tmpDir, nil
+       return dataPath, nil
 }
 
 func (m *monitor) Run() {
@@ -113,8 +114,10 @@ func (m *monitor) Run() {
                log.Fatal(err)
        }
 
-       go m.discoveryRoutine()
-       go m.collectDiscoveredNodes()
+       m.dialCh <- struct{}{}
+       var discvWg sync.WaitGroup
+       go m.discoveryRoutine(&discvWg)
+       go m.collectDiscoveredNodes(&discvWg)
        go m.connectNodesRoutine()
        go m.checkStatusRoutine()
 }
@@ -149,7 +152,7 @@ func (m *monitor) prepareReactors(peers *peers.PeerSet) error {
        }
 
        for label, reactor := range m.sw.GetReactors() {
-               log.Debug("start reactor: (%s:%v)", label, reactor)
+               log.Debugf("start reactor: (%s:%v)", label, reactor)
                if _, err := reactor.Start(); err != nil {
                        return nil
                }
@@ -157,37 +160,22 @@ func (m *monitor) prepareReactors(peers *peers.PeerSet) error {
 
        m.sw.GetSecurity().RegisterFilter(m.sw.GetNodeInfo())
        m.sw.GetSecurity().RegisterFilter(m.sw.GetPeers())
-
        return m.sw.GetSecurity().Start()
 }
 
-// TODO:
-// 现象是,时间区间过小时,  会一直有 dial ,但是不能 send业务层 msg
-// 还不确定是不是死锁,时间调大一点比如15s 就可以正确运行
-// 想法,自己再另外加锁,或者找到锁住的真正原因
 func (m *monitor) checkStatusRoutine() {
        peers := peers.NewPeerSet(m.sw)
        if err := m.prepareReactors(peers); err != nil {
                log.Fatal(err)
        }
 
-       protocolReactor, ok := m.sw.GetReactors()["PROTOCOL"]
-       if !ok {
-               log.Fatal("protocolReactor not found")
-       }
-
        bestHeight := uint64(0)
-       ticker := time.NewTicker(time.Duration(m.cfg.CheckFreqSeconds) * time.Second)
-       for range ticker.C {
-               for !m.isConnected() {
-                       time.Sleep(1 * time.Second)
-               }
-               log.Info("connected peers: ", m.sw.GetPeers().List())
-
+       for range m.checkStatusCh {
                for _, peer := range m.sw.GetPeers().List() {
                        peer.Start()
-                       protocolReactor.AddPeer(peer)
+                       peers.AddPeer(peer)
                }
+               log.Infof("%d connected peers: %v", len(m.sw.GetPeers().List()), m.sw.GetPeers().List())
 
                for _, peer := range m.sw.GetPeers().List() {
                        p := peers.GetPeer(peer.ID())
@@ -196,6 +184,7 @@ func (m *monitor) checkStatusRoutine() {
                        }
 
                        if err := p.SendStatus(m.chain.BestBlockHeader(), m.chain.LastIrreversibleHeader()); err != nil {
+                               log.Error(err)
                                peers.RemovePeer(p.ID())
                        }
                }
@@ -204,16 +193,9 @@ func (m *monitor) checkStatusRoutine() {
                        if peerInfo.Height > bestHeight {
                                bestHeight = peerInfo.Height
                        }
-
-                       m.savePeerInfo(peerInfo)
                }
                log.Info("bestHeight: ", bestHeight)
-
-               // TODO:
-               // msg := struct{ msgs.BlockchainMessage }{&msgs.GetBlockMessage{Height: bestHeight + 1}}
-               // for _, peer := range m.sw.GetPeers().List() {
-               //      peers.SendMsg(peer.ID(), msgs.BlockchainChannel, msg)
-               // }
+               m.processPeerInfos(peers.GetPeerInfos())
 
                for _, peer := range m.sw.GetPeers().List() {
                        p := peers.GetPeer(peer.ID())
@@ -223,21 +205,8 @@ func (m *monitor) checkStatusRoutine() {
 
                        peers.RemovePeer(p.ID())
                }
-
-               m.setDisonnected()
                log.Info("Disonnect all peers.")
+               m.Unlock()
+               m.dialCh <- struct{}{}
        }
 }
-
-func (m *monitor) isConnected() bool {
-       atomic.LoadUint32(&m.connected)
-       return m.connected == uint32(1)
-}
-
-func (m *monitor) setConnected() {
-       atomic.StoreUint32(&m.connected, 1)
-}
-
-func (m *monitor) setDisonnected() {
-       atomic.StoreUint32(&m.connected, 0)
-}