]> asedeno.scripts.mit.edu Git - linux.git/blob - include/linux/memory_hotplug.h
mm/memory_hotplug: allow arch_remove_memory() without CONFIG_MEMORY_HOTREMOVE
[linux.git] / include / linux / memory_hotplug.h
1 /* SPDX-License-Identifier: GPL-2.0 */
2 #ifndef __LINUX_MEMORY_HOTPLUG_H
3 #define __LINUX_MEMORY_HOTPLUG_H
4
5 #include <linux/mmzone.h>
6 #include <linux/spinlock.h>
7 #include <linux/notifier.h>
8 #include <linux/bug.h>
9
10 struct page;
11 struct zone;
12 struct pglist_data;
13 struct mem_section;
14 struct memory_block;
15 struct resource;
16 struct vmem_altmap;
17
18 #ifdef CONFIG_MEMORY_HOTPLUG
19 /*
20  * Return page for the valid pfn only if the page is online. All pfn
21  * walkers which rely on the fully initialized page->flags and others
22  * should use this rather than pfn_valid && pfn_to_page
23  */
24 #define pfn_to_online_page(pfn)                                    \
25 ({                                                                 \
26         struct page *___page = NULL;                               \
27         unsigned long ___pfn = pfn;                                \
28         unsigned long ___nr = pfn_to_section_nr(___pfn);           \
29                                                                    \
30         if (___nr < NR_MEM_SECTIONS && online_section_nr(___nr) && \
31             pfn_valid_within(___pfn))                              \
32                 ___page = pfn_to_page(___pfn);                     \
33         ___page;                                                   \
34 })
35
36 /*
37  * Types for free bootmem stored in page->lru.next. These have to be in
38  * some random range in unsigned long space for debugging purposes.
39  */
40 enum {
41         MEMORY_HOTPLUG_MIN_BOOTMEM_TYPE = 12,
42         SECTION_INFO = MEMORY_HOTPLUG_MIN_BOOTMEM_TYPE,
43         MIX_SECTION_INFO,
44         NODE_INFO,
45         MEMORY_HOTPLUG_MAX_BOOTMEM_TYPE = NODE_INFO,
46 };
47
48 /* Types for control the zone type of onlined and offlined memory */
49 enum {
50         MMOP_OFFLINE = -1,
51         MMOP_ONLINE_KEEP,
52         MMOP_ONLINE_KERNEL,
53         MMOP_ONLINE_MOVABLE,
54 };
55
56 /*
57  * Restrictions for the memory hotplug:
58  * flags:  MHP_ flags
59  * altmap: alternative allocator for memmap array
60  */
61 struct mhp_restrictions {
62         unsigned long flags;
63         struct vmem_altmap *altmap;
64 };
65
66 /*
67  * Zone resizing functions
68  *
69  * Note: any attempt to resize a zone should has pgdat_resize_lock()
70  * zone_span_writelock() both held. This ensure the size of a zone
71  * can't be changed while pgdat_resize_lock() held.
72  */
73 static inline unsigned zone_span_seqbegin(struct zone *zone)
74 {
75         return read_seqbegin(&zone->span_seqlock);
76 }
77 static inline int zone_span_seqretry(struct zone *zone, unsigned iv)
78 {
79         return read_seqretry(&zone->span_seqlock, iv);
80 }
81 static inline void zone_span_writelock(struct zone *zone)
82 {
83         write_seqlock(&zone->span_seqlock);
84 }
85 static inline void zone_span_writeunlock(struct zone *zone)
86 {
87         write_sequnlock(&zone->span_seqlock);
88 }
89 static inline void zone_seqlock_init(struct zone *zone)
90 {
91         seqlock_init(&zone->span_seqlock);
92 }
93 extern int zone_grow_free_lists(struct zone *zone, unsigned long new_nr_pages);
94 extern int zone_grow_waitqueues(struct zone *zone, unsigned long nr_pages);
95 extern int add_one_highpage(struct page *page, int pfn, int bad_ppro);
96 /* VM interface that may be used by firmware interface */
97 extern int online_pages(unsigned long, unsigned long, int);
98 extern int test_pages_in_a_zone(unsigned long start_pfn, unsigned long end_pfn,
99         unsigned long *valid_start, unsigned long *valid_end);
100 extern unsigned long __offline_isolated_pages(unsigned long start_pfn,
101                                                 unsigned long end_pfn);
102
103 typedef void (*online_page_callback_t)(struct page *page, unsigned int order);
104
105 extern int set_online_page_callback(online_page_callback_t callback);
106 extern int restore_online_page_callback(online_page_callback_t callback);
107
108 extern void __online_page_set_limits(struct page *page);
109 extern void __online_page_increment_counters(struct page *page);
110 extern void __online_page_free(struct page *page);
111
112 extern int try_online_node(int nid);
113
114 extern int arch_add_memory(int nid, u64 start, u64 size,
115                         struct mhp_restrictions *restrictions);
116 extern u64 max_mem_size;
117
118 extern bool memhp_auto_online;
119 /* If movable_node boot option specified */
120 extern bool movable_node_enabled;
121 static inline bool movable_node_is_enabled(void)
122 {
123         return movable_node_enabled;
124 }
125
126 extern void arch_remove_memory(int nid, u64 start, u64 size,
127                                struct vmem_altmap *altmap);
128 extern void __remove_pages(struct zone *zone, unsigned long start_pfn,
129                            unsigned long nr_pages, struct vmem_altmap *altmap);
130
131 /*
132  * Do we want sysfs memblock files created. This will allow userspace to online
133  * and offline memory explicitly. Lack of this bit means that the caller has to
134  * call move_pfn_range_to_zone to finish the initialization.
135  */
136
137 #define MHP_MEMBLOCK_API               (1<<0)
138
139 /* reasonably generic interface to expand the physical pages */
140 extern int __add_pages(int nid, unsigned long start_pfn, unsigned long nr_pages,
141                        struct mhp_restrictions *restrictions);
142
143 #ifndef CONFIG_ARCH_HAS_ADD_PAGES
144 static inline int add_pages(int nid, unsigned long start_pfn,
145                 unsigned long nr_pages, struct mhp_restrictions *restrictions)
146 {
147         return __add_pages(nid, start_pfn, nr_pages, restrictions);
148 }
149 #else /* ARCH_HAS_ADD_PAGES */
150 int add_pages(int nid, unsigned long start_pfn, unsigned long nr_pages,
151               struct mhp_restrictions *restrictions);
152 #endif /* ARCH_HAS_ADD_PAGES */
153
154 #ifdef CONFIG_NUMA
155 extern int memory_add_physaddr_to_nid(u64 start);
156 #else
157 static inline int memory_add_physaddr_to_nid(u64 start)
158 {
159         return 0;
160 }
161 #endif
162
163 #ifdef CONFIG_HAVE_ARCH_NODEDATA_EXTENSION
164 /*
165  * For supporting node-hotadd, we have to allocate a new pgdat.
166  *
167  * If an arch has generic style NODE_DATA(),
168  * node_data[nid] = kzalloc() works well. But it depends on the architecture.
169  *
170  * In general, generic_alloc_nodedata() is used.
171  * Now, arch_free_nodedata() is just defined for error path of node_hot_add.
172  *
173  */
174 extern pg_data_t *arch_alloc_nodedata(int nid);
175 extern void arch_free_nodedata(pg_data_t *pgdat);
176 extern void arch_refresh_nodedata(int nid, pg_data_t *pgdat);
177
178 #else /* CONFIG_HAVE_ARCH_NODEDATA_EXTENSION */
179
180 #define arch_alloc_nodedata(nid)        generic_alloc_nodedata(nid)
181 #define arch_free_nodedata(pgdat)       generic_free_nodedata(pgdat)
182
183 #ifdef CONFIG_NUMA
184 /*
185  * If ARCH_HAS_NODEDATA_EXTENSION=n, this func is used to allocate pgdat.
186  * XXX: kmalloc_node() can't work well to get new node's memory at this time.
187  *      Because, pgdat for the new node is not allocated/initialized yet itself.
188  *      To use new node's memory, more consideration will be necessary.
189  */
190 #define generic_alloc_nodedata(nid)                             \
191 ({                                                              \
192         kzalloc(sizeof(pg_data_t), GFP_KERNEL);                 \
193 })
194 /*
195  * This definition is just for error path in node hotadd.
196  * For node hotremove, we have to replace this.
197  */
198 #define generic_free_nodedata(pgdat)    kfree(pgdat)
199
200 extern pg_data_t *node_data[];
201 static inline void arch_refresh_nodedata(int nid, pg_data_t *pgdat)
202 {
203         node_data[nid] = pgdat;
204 }
205
206 #else /* !CONFIG_NUMA */
207
208 /* never called */
209 static inline pg_data_t *generic_alloc_nodedata(int nid)
210 {
211         BUG();
212         return NULL;
213 }
214 static inline void generic_free_nodedata(pg_data_t *pgdat)
215 {
216 }
217 static inline void arch_refresh_nodedata(int nid, pg_data_t *pgdat)
218 {
219 }
220 #endif /* CONFIG_NUMA */
221 #endif /* CONFIG_HAVE_ARCH_NODEDATA_EXTENSION */
222
223 #ifdef CONFIG_HAVE_BOOTMEM_INFO_NODE
224 extern void __init register_page_bootmem_info_node(struct pglist_data *pgdat);
225 #else
226 static inline void register_page_bootmem_info_node(struct pglist_data *pgdat)
227 {
228 }
229 #endif
230 extern void put_page_bootmem(struct page *page);
231 extern void get_page_bootmem(unsigned long ingo, struct page *page,
232                              unsigned long type);
233
234 void get_online_mems(void);
235 void put_online_mems(void);
236
237 void mem_hotplug_begin(void);
238 void mem_hotplug_done(void);
239
240 extern void set_zone_contiguous(struct zone *zone);
241 extern void clear_zone_contiguous(struct zone *zone);
242
243 #else /* ! CONFIG_MEMORY_HOTPLUG */
244 #define pfn_to_online_page(pfn)                 \
245 ({                                              \
246         struct page *___page = NULL;            \
247         if (pfn_valid(pfn))                     \
248                 ___page = pfn_to_page(pfn);     \
249         ___page;                                \
250  })
251
252 static inline unsigned zone_span_seqbegin(struct zone *zone)
253 {
254         return 0;
255 }
256 static inline int zone_span_seqretry(struct zone *zone, unsigned iv)
257 {
258         return 0;
259 }
260 static inline void zone_span_writelock(struct zone *zone) {}
261 static inline void zone_span_writeunlock(struct zone *zone) {}
262 static inline void zone_seqlock_init(struct zone *zone) {}
263
264 static inline int mhp_notimplemented(const char *func)
265 {
266         printk(KERN_WARNING "%s() called, with CONFIG_MEMORY_HOTPLUG disabled\n", func);
267         dump_stack();
268         return -ENOSYS;
269 }
270
271 static inline void register_page_bootmem_info_node(struct pglist_data *pgdat)
272 {
273 }
274
275 static inline int try_online_node(int nid)
276 {
277         return 0;
278 }
279
280 static inline void get_online_mems(void) {}
281 static inline void put_online_mems(void) {}
282
283 static inline void mem_hotplug_begin(void) {}
284 static inline void mem_hotplug_done(void) {}
285
286 static inline bool movable_node_is_enabled(void)
287 {
288         return false;
289 }
290 #endif /* ! CONFIG_MEMORY_HOTPLUG */
291
292 #if defined(CONFIG_MEMORY_HOTPLUG) || defined(CONFIG_DEFERRED_STRUCT_PAGE_INIT)
293 /*
294  * pgdat resizing functions
295  */
296 static inline
297 void pgdat_resize_lock(struct pglist_data *pgdat, unsigned long *flags)
298 {
299         spin_lock_irqsave(&pgdat->node_size_lock, *flags);
300 }
301 static inline
302 void pgdat_resize_unlock(struct pglist_data *pgdat, unsigned long *flags)
303 {
304         spin_unlock_irqrestore(&pgdat->node_size_lock, *flags);
305 }
306 static inline
307 void pgdat_resize_init(struct pglist_data *pgdat)
308 {
309         spin_lock_init(&pgdat->node_size_lock);
310 }
311 #else /* !(CONFIG_MEMORY_HOTPLUG || CONFIG_DEFERRED_STRUCT_PAGE_INIT) */
312 /*
313  * Stub functions for when hotplug is off
314  */
315 static inline void pgdat_resize_lock(struct pglist_data *p, unsigned long *f) {}
316 static inline void pgdat_resize_unlock(struct pglist_data *p, unsigned long *f) {}
317 static inline void pgdat_resize_init(struct pglist_data *pgdat) {}
318 #endif /* !(CONFIG_MEMORY_HOTPLUG || CONFIG_DEFERRED_STRUCT_PAGE_INIT) */
319
320 #ifdef CONFIG_MEMORY_HOTREMOVE
321
322 extern bool is_mem_section_removable(unsigned long pfn, unsigned long nr_pages);
323 extern void try_offline_node(int nid);
324 extern int offline_pages(unsigned long start_pfn, unsigned long nr_pages);
325 extern int remove_memory(int nid, u64 start, u64 size);
326 extern void __remove_memory(int nid, u64 start, u64 size);
327
328 #else
329 static inline bool is_mem_section_removable(unsigned long pfn,
330                                         unsigned long nr_pages)
331 {
332         return false;
333 }
334
335 static inline void try_offline_node(int nid) {}
336
337 static inline int offline_pages(unsigned long start_pfn, unsigned long nr_pages)
338 {
339         return -EINVAL;
340 }
341
342 static inline int remove_memory(int nid, u64 start, u64 size)
343 {
344         return -EBUSY;
345 }
346
347 static inline void __remove_memory(int nid, u64 start, u64 size) {}
348 #endif /* CONFIG_MEMORY_HOTREMOVE */
349
350 extern void __ref free_area_init_core_hotplug(int nid);
351 extern int walk_memory_range(unsigned long start_pfn, unsigned long end_pfn,
352                 void *arg, int (*func)(struct memory_block *, void *));
353 extern int __add_memory(int nid, u64 start, u64 size);
354 extern int add_memory(int nid, u64 start, u64 size);
355 extern int add_memory_resource(int nid, struct resource *resource);
356 extern void move_pfn_range_to_zone(struct zone *zone, unsigned long start_pfn,
357                 unsigned long nr_pages, struct vmem_altmap *altmap);
358 extern bool is_memblock_offlined(struct memory_block *mem);
359 extern int sparse_add_one_section(int nid, unsigned long start_pfn,
360                                   struct vmem_altmap *altmap);
361 extern void sparse_remove_one_section(struct zone *zone, struct mem_section *ms,
362                 unsigned long map_offset, struct vmem_altmap *altmap);
363 extern struct page *sparse_decode_mem_map(unsigned long coded_mem_map,
364                                           unsigned long pnum);
365 extern bool allow_online_pfn_range(int nid, unsigned long pfn, unsigned long nr_pages,
366                 int online_type);
367 extern struct zone *zone_for_pfn_range(int online_type, int nid, unsigned start_pfn,
368                 unsigned long nr_pages);
369 #endif /* __LINUX_MEMORY_HOTPLUG_H */