MIPS: VDSO: Prevent use of smp_processor_id()

[android-x86/kernel.git] / mm / memcontrol.c
diff --git a/mm/memcontrol.c b/mm/memcontrol.c

index 0f870ba..cbcbba0 100644 (file)
--- a/mm/memcontrol.c
+++ b/mm/memcontrol.c
@@ -462,6 +462,8 @@ static void mem_cgroup_update_tree(struct mem_cgroup *memcg, struct page *page)
         struct mem_cgroup_tree_per_node *mctz;
  
         mctz = soft_limit_tree_from_page(page);
+       if (!mctz)
+               return;
         /*
          * Necessary to update all ancestors when hierarchy is used.
          * because their event counter is not touched.
@@ -499,7 +501,8 @@ static void mem_cgroup_remove_from_trees(struct mem_cgroup *memcg)
         for_each_node(nid) {
                 mz = mem_cgroup_nodeinfo(memcg, nid);
                 mctz = soft_limit_tree_node(nid);
-               mem_cgroup_remove_exceeded(mz, mctz);
+               if (mctz)
+                       mem_cgroup_remove_exceeded(mz, mctz);
         }
  }
  
@@ -625,8 +628,8 @@ static void mem_cgroup_charge_statistics(struct mem_cgroup *memcg,
  unsigned long mem_cgroup_node_nr_lru_pages(struct mem_cgroup *memcg,
                                            int nid, unsigned int lru_mask)
  {
+       struct lruvec *lruvec = mem_cgroup_lruvec(NODE_DATA(nid), memcg);
         unsigned long nr = 0;
-       struct mem_cgroup_per_node *mz;
         enum lru_list lru;
  
         VM_BUG_ON((unsigned)nid >= nr_node_ids);
@@ -634,8 +637,7 @@ unsigned long mem_cgroup_node_nr_lru_pages(struct mem_cgroup *memcg,
         for_each_lru(lru) {
                 if (!(BIT(lru) & lru_mask))
                         continue;
-               mz = mem_cgroup_nodeinfo(memcg, nid);
-               nr += mz->lru_size[lru];
+               nr += mem_cgroup_get_lru_size(lruvec, lru);
         }
         return nr;
  }
@@ -885,26 +887,45 @@ void mem_cgroup_iter_break(struct mem_cgroup *root,
                 css_put(&prev->css);
  }
  
-static void invalidate_reclaim_iterators(struct mem_cgroup *dead_memcg)
+static void __invalidate_reclaim_iterators(struct mem_cgroup *from,
+                                       struct mem_cgroup *dead_memcg)
  {
-       struct mem_cgroup *memcg = dead_memcg;
         struct mem_cgroup_reclaim_iter *iter;
         struct mem_cgroup_per_node *mz;
         int nid;
         int i;
  
-       while ((memcg = parent_mem_cgroup(memcg))) {
-               for_each_node(nid) {
-                       mz = mem_cgroup_nodeinfo(memcg, nid);
-                       for (i = 0; i <= DEF_PRIORITY; i++) {
-                               iter = &mz->iter[i];
-                               cmpxchg(&iter->position,
-                                       dead_memcg, NULL);
-                       }
+       for_each_node(nid) {
+               mz = mem_cgroup_nodeinfo(from, nid);
+               for (i = 0; i <= DEF_PRIORITY; i++) {
+                       iter = &mz->iter[i];
+                       cmpxchg(&iter->position,
+                               dead_memcg, NULL);
                 }
         }
  }
  
+static void invalidate_reclaim_iterators(struct mem_cgroup *dead_memcg)
+{
+       struct mem_cgroup *memcg = dead_memcg;
+       struct mem_cgroup *last;
+
+       do {
+               __invalidate_reclaim_iterators(memcg, dead_memcg);
+               last = memcg;
+       } while ((memcg = parent_mem_cgroup(memcg)));
+
+       /*
+        * When cgruop1 non-hierarchy mode is used,
+        * parent_mem_cgroup() does not walk all the way up to the
+        * cgroup root (root_mem_cgroup). So we have to handle
+        * dead_memcg from cgroup root separately.
+        */
+       if (last != root_mem_cgroup)
+               __invalidate_reclaim_iterators(root_mem_cgroup,
+                                               dead_memcg);
+}
+
  /*
   * Iteration constructs for visiting all cgroups (under a tree).  If
   * loops are exited prematurely (break), mem_cgroup_iter_break() must
@@ -1002,6 +1023,7 @@ out:
   * mem_cgroup_update_lru_size - account for adding or removing an lru page
   * @lruvec: mem_cgroup per zone lru vector
   * @lru: index of lru list the page is sitting on
+ * @zid: zone id of the accounted pages
   * @nr_pages: positive when adding or negative when removing
   *
   * This function must be called under lru_lock, just before a page is added
@@ -1009,27 +1031,25 @@ out:
   * so as to allow it to check that lru_size 0 is consistent with list_empty).
   */
  void mem_cgroup_update_lru_size(struct lruvec *lruvec, enum lru_list lru,
-                               int nr_pages)
+                               int zid, int nr_pages)
  {
         struct mem_cgroup_per_node *mz;
         unsigned long *lru_size;
         long size;
-       bool empty;
  
         if (mem_cgroup_disabled())
                 return;
  
         mz = container_of(lruvec, struct mem_cgroup_per_node, lruvec);
-       lru_size = mz->lru_size + lru;
-       empty = list_empty(lruvec->lists + lru);
+       lru_size = &mz->lru_zone_size[zid][lru];
  
         if (nr_pages < 0)
                 *lru_size += nr_pages;
  
         size = *lru_size;
-       if (WARN_ONCE(size < 0 || empty != !size,
-               "%s(%p, %d, %d): lru_size %ld but %sempty\n",
-               __func__, lruvec, lru, nr_pages, size, empty ? "" : "not ")) {
+       if (WARN_ONCE(size < 0,
+               "%s(%p, %d, %d): lru_size %ld\n",
+               __func__, lruvec, lru, nr_pages, size)) {
                 VM_BUG_ON(1);
                 *lru_size = 0;
         }
@@ -2154,6 +2174,8 @@ struct memcg_kmem_cache_create_work {
         struct work_struct work;
  };
  
+static struct workqueue_struct *memcg_kmem_cache_create_wq;
+
  static void memcg_kmem_cache_create_func(struct work_struct *w)
  {
         struct memcg_kmem_cache_create_work *cw =
@@ -2185,7 +2207,7 @@ static void __memcg_schedule_kmem_cache_create(struct mem_cgroup *memcg,
         cw->cachep = cachep;
         INIT_WORK(&cw->work, memcg_kmem_cache_create_func);
  
-       schedule_work(&cw->work);
+       queue_work(memcg_kmem_cache_create_wq, &cw->work);
  }
  
  static void memcg_schedule_kmem_cache_create(struct mem_cgroup *memcg,
@@ -2565,7 +2587,7 @@ unsigned long mem_cgroup_soft_limit_reclaim(pg_data_t *pgdat, int order,
          * is empty. Do it lockless to prevent lock bouncing. Races
          * are acceptable as soft limit is best effort anyway.
          */
-       if (RB_EMPTY_ROOT(&mctz->rb_root))
+       if (!mctz || RB_EMPTY_ROOT(&mctz->rb_root))
                 return 0;
  
         /*
@@ -4069,6 +4091,14 @@ static struct cftype mem_cgroup_legacy_files[] = {
  
  static DEFINE_IDR(mem_cgroup_idr);
  
+static void mem_cgroup_id_remove(struct mem_cgroup *memcg)
+{
+       if (memcg->id.id > 0) {
+               idr_remove(&mem_cgroup_idr, memcg->id.id);
+               memcg->id.id = 0;
+       }
+}
+
  static void mem_cgroup_id_get_many(struct mem_cgroup *memcg, unsigned int n)
  {
         VM_BUG_ON(atomic_read(&memcg->id.ref) <= 0);
@@ -4079,8 +4109,7 @@ static void mem_cgroup_id_put_many(struct mem_cgroup *memcg, unsigned int n)
  {
         VM_BUG_ON(atomic_read(&memcg->id.ref) < n);
         if (atomic_sub_and_test(n, &memcg->id.ref)) {
-               idr_remove(&mem_cgroup_idr, memcg->id.id);
-               memcg->id.id = 0;
+               mem_cgroup_id_remove(memcg);
  
                 /* Memcg ID pins CSS */
                 css_put(&memcg->css);
@@ -4141,17 +4170,22 @@ static void free_mem_cgroup_per_node_info(struct mem_cgroup *memcg, int node)
         kfree(memcg->nodeinfo[node]);
  }
  
-static void mem_cgroup_free(struct mem_cgroup *memcg)
+static void __mem_cgroup_free(struct mem_cgroup *memcg)
  {
         int node;
  
-       memcg_wb_domain_exit(memcg);
         for_each_node(node)
                 free_mem_cgroup_per_node_info(memcg, node);
         free_percpu(memcg->stat);
         kfree(memcg);
  }
  
+static void mem_cgroup_free(struct mem_cgroup *memcg)
+{
+       memcg_wb_domain_exit(memcg);
+       __mem_cgroup_free(memcg);
+}
+
  static struct mem_cgroup *mem_cgroup_alloc(void)
  {
         struct mem_cgroup *memcg;
@@ -4200,9 +4234,8 @@ static struct mem_cgroup *mem_cgroup_alloc(void)
         idr_replace(&mem_cgroup_idr, memcg, memcg->id.id);
         return memcg;
  fail:
-       if (memcg->id.id > 0)
-               idr_remove(&mem_cgroup_idr, memcg->id.id);
-       mem_cgroup_free(memcg);
+       mem_cgroup_id_remove(memcg);
+       __mem_cgroup_free(memcg);
         return NULL;
  }
  
@@ -4260,6 +4293,7 @@ mem_cgroup_css_alloc(struct cgroup_subsys_state *parent_css)
  
         return &memcg->css;
  fail:
+       mem_cgroup_id_remove(memcg);
         mem_cgroup_free(memcg);
         return ERR_PTR(-ENOMEM);
  }
@@ -4362,9 +4396,9 @@ static int mem_cgroup_do_precharge(unsigned long count)
                 return ret;
         }
  
-       /* Try charges one by one with reclaim */
+       /* Try charges one by one with reclaim, but do not retry */
         while (count--) {
-               ret = try_charge(mc.to, GFP_KERNEL & ~__GFP_NORETRY, 1);
+               ret = try_charge(mc.to, GFP_KERNEL | __GFP_NORETRY, 1);
                 if (ret)
                         return ret;
                 mc.precharge++;
@@ -5523,7 +5557,7 @@ static void uncharge_list(struct list_head *page_list)
                 next = page->lru.next;
  
                 VM_BUG_ON_PAGE(PageLRU(page), page);
-               VM_BUG_ON_PAGE(page_count(page), page);
+               VM_BUG_ON_PAGE(!PageHWPoison(page) && page_count(page), page);
  
                 if (!page->mem_cgroup)
                         continue;
@@ -5783,6 +5817,17 @@ static int __init mem_cgroup_init(void)
  {
         int cpu, node;
  
+#ifndef CONFIG_SLOB
+       /*
+        * Kmem cache creation is mostly done with the slab_mutex held,
+        * so use a special workqueue to avoid stalling all worker
+        * threads in case lots of cgroups are created simultaneously.
+        */
+       memcg_kmem_cache_create_wq =
+               alloc_ordered_workqueue("memcg_kmem_cache_create", 0);
+       BUG_ON(!memcg_kmem_cache_create_wq);
+#endif
+
         hotcpu_notifier(memcg_cpu_hotplug_callback, 0);
  
         for_each_possible_cpu(cpu)